Trabajo 1 Inferencia Estadistica [1]

21
INFERENCIA ESTADISTICA TRABAJO COLABORATIVO 1 POR: HUGO HERNANDO MEJIA BARAJAS CC. 13.928.726 DAVID PASTOR MORALES C.C HERNAN ALONSO RESTREPO C.C 10140736 JUAN DAVID QUITIAN C.C SERGIO MAYORGA RODRIGUEZ C.C. 91505700 PRESENTADO A: DANYS BRITO INFERENCIA ESTADISTICA

Transcript of Trabajo 1 Inferencia Estadistica [1]

Page 1: Trabajo 1 Inferencia Estadistica [1]

INFERENCIA ESTADISTICA

TRABAJO COLABORATIVO 1

POR:

HUGO HERNANDO MEJIA BARAJAS CC. 13.928.726

DAVID PASTOR MORALES C.C

HERNAN ALONSO RESTREPO C.C 10140736

JUAN DAVID QUITIAN C.C

SERGIO MAYORGA RODRIGUEZ C.C. 91505700

PRESENTADO A:

DANYS BRITO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

MALAGA

INFERENCIA ESTADISTICA

Page 2: Trabajo 1 Inferencia Estadistica [1]

INTRODUCCIÓN

El objetivo más importante de la Estadística es obtener una inferencia con respecto a la población basándose en la información contenida en una muestra. Como las poblaciones se describen mediante medidas numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población.

Se han estudiado, hasta el momento, las nociones fundamentales de distribución de probabilidades; se está en condiciones, entonces, de tratar los métodos de inferencia estadística, los cuales comprenden los procedimientos para estimar parámetros de poblaciones y probar (contrastar) si una afirmación provisional sobre un parámetro poblacional se ve apoyada o desaprobada ante la evidencia de la muestra.

El uso principal de la inferencia estadística en la investigación empírica, es lograr conocimiento de una gran clase de unidades estadísticas (seres humanos, plantas, parcelas de tierra), de un número relativamente pequeño de los mismos elementos.

Los métodos de inferencia estadística emplean el razonamiento inductivo, razonamiento de lo particular a lo general y de lo observado a lo no observado.

Cualquier colección o agregación grande de cosas que deseamos estudiar o de las cuales deseamos hacer inferencias, se llama población. El término población tiene más significado cuando se lo junta con la definición de muestra de una población: una muestra es una parte o subconjunto de una población.

Una muestra de n elementos de la población de N elementos, debería ser seleccionada de forma tal que las características de la población puedan ser estimadas con un margen de error conocido.

Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parámetros. Para las muestras, estas mismas medidas descriptivas se llaman estadísticas.

Un parámetro describe una población de la misma manera que una estadística describe a una muestra.

INFERENCIA ESTADISTICA

Page 3: Trabajo 1 Inferencia Estadistica [1]

OBJETIVOS

Aplicar las técnicas de muestreo y de intervalos de confianza, realizando inferencias sobre los parámetros de la media y el total poblacional y determinar su validez estadística comparándolos con los datos reales.

Medir el nivel de progreso en las metas de aprendizajes de conceptos y sus relaciones en el ámbito de la estimación y el muestreo.

INFERENCIA ESTADISTICA

Page 4: Trabajo 1 Inferencia Estadistica [1]

DESARROLLO DE LOS PROBLEMAS U EJERCICIOS

1. Explique la diferencia entre cada par de términos:

Muestreo por conglomerado y muestreo estratificado:

En el método de muestreo por conglomerado se realiza una división del grupo de elementos de la población en forma natural en subgrupos, mientras que en el muestreo estratificado se hace una división categorizada dependiendo de características especificas de la población, en este se busca que las características de cada subgrupo sea lo mas homogéneo posible y la selección se hace uno a uno en base a sus características, no así en el caso del conglomerado pues las características de los elementos de cada subgrupo pueden tener características heterogéneas y aun así es valida la separación.

El muestreo por conglomerado es útil cuando no se dispone de una lista detallada de cada una de las unidades que conforman el universo y resulta muy complicada su elaboración.

Error muestral y error No muestral

El error muestral corresponde a la diferencia entre la media muestral y la media poblacional y el cual esta dado por errores generados por la variación natural existente entre las muestras tomadas de la misma población

Mientra que el error no muestral son los errores que se obtienen debido al un sesgo no tenido en cuenta o introducido a propósito, presentado en la selección de las muestras o en el proceso de investigación, el ejemplo mas claro son los errores introducidos por fallas en la tomas de las muestras

Muestreo simple y muestreo sistemático

Se diferencian los dos tipos de muestreo siendo ambos aleatorios en que le muestreo simple se realiza la selección de cada uno de los elementos de la población de manera aleatoria, mientras que en el muestreo sistemático, se seleccionan de la población completa uno a uno los elementos iniciando aleatoriamente la primera selección y los siguientes con un lapso determinado, es decir se cuenta a partir del primer elemento seleccionado un lapso determinado en la lista de elementos de la población y cada numero de elementos determinados por el lapso seleccionado se toma otro elemento.

INFERENCIA ESTADISTICA

Page 5: Trabajo 1 Inferencia Estadistica [1]

Muestra aleatoria y muestra No aleatoria.

La muestra aleatoria es la selección de una cantidad de elementos representativos de una población al azar, sin tener ninguna consideración, en este caso todos los elementos de la población tienen la misma probabilidad de ser seleccionados, mientras que las muestras no aleatorias, son las que se realizan de una población y se seleccionan elementos de una característica determinada y se hace la selección uno a uno en base a esa característica que se esta buscando, si un elemento un elemento presenta la característica buscada tiene un porcentaje alto de ser seleccionado mientras que si no presenta esa característica la probabilidad de ese elemento de ser seleccionado será cero.

2. La estimación se puede hacer a su vez por dos procedimientos

¿Cuáles son?

Estimación puntual: consiste en un solo estadístico muestral que se usa para estimar el valor verdadero de un parámetro de una población que es desconocido. Este valor es único y pretende representar una población desconocida, una estimación puntual frecuentemente es insuficiente debido a que puede ser representativa de la población o no, esta puede llegar a ser útil si se acompaña de una estimación del error.

El mejor estimador puntual es la media de la muestra de la población. Es imparcial, coherente, el estimador más eficiente y, siempre y cuando la muestra sea la suficientemente grande, su distribución de muestreo puede ser aproximada por la distribución normal.

Estimación por intervalo: es la estimación de un parámetro de la población dado por dos números que forman un intervalo que contiene al parámetro con una cierta probabilidad.Este intervalo de valores se utiliza para estimar un parámetro de población. Esta estimación indica el error de dos maneras: por la extensión del intervalo y por la probabilidad de obtener el verdadero parámetro de la población que se encuentra dentro del intervalo.

¿Qué ventajas tiene cada uno?

La ventaja de La estimación puntual, es que esta de entrada nos indica cual es el valor más probable de la población, siempre y cunado este sea representativo o en caso contrario venga acompañado de la estimación de error.

La desventaja es que si el valor no es representativo de la población puede sesgar todos los cálculos que se realicen con este valor y las decisiones que se tomen sobre la población podrían no ser las adecuadas. Adicionalmente esta claro que la estimación puntual no garantiza ni mide la precisión de la estimación

En el caso de la estimación por intervalo, la ventaja de este es que puede llegar a ser mas confiable puesto que se garantiza en un porcentaje muy alto que el valor estadístico

INFERENCIA ESTADISTICA

Page 6: Trabajo 1 Inferencia Estadistica [1]

de un elemento se encuentra dentro del intervalo enunciado por la estimación, y la probabilidad depende del nivel de confianza calculado para este intervalo.

La desventaja es que se hace más complejo el manejo de dos valores que representan un intervalo comparado con la estimación puntual que se representa por un solo valor.

3. A qué se refiere el margen de error en un intervalo de confianza.

Un intervalo de confianza, es un conjunto de valores formado a partir de una muestra de datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad especifica, la probabilidad especifica se denomina nivel de confianza, el error en un intervalo de confianza quiere decir la probabilidad de que un elemento especifico no este contenido dentro del intervalo de confianza.

4. Explique cuáles son los criterios que debe cumplir un muestra seleccionada de población para considerarla representativa de dicha población.

- uno de los aspectos más importante para determinar si una muestra es representativa de una población es garantizar que cada elemento que se selecciones de la población debe tener la misma probabilidad de ser elegido.

- Una muestra es representativa de la población de donde se extrajo, cuando refleja las similitudes y diferencias de la población

5. Explique el tipo de relación directa o inversamente proporcional de cada uno de los factores involucrados en el cálculo del tamaño de la muestra de una población finita, para estimar la media de la población.

Tabla 1.  Elementos de la Inferencia Estadística

Estimar una media:

Si deseamos estimar una media, debemos saber:

INFERENCIA ESTADISTICA

Page 7: Trabajo 1 Inferencia Estadistica [1]

El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58.

La precisión con que se desea estimar el parámetro (2 * d es la amplitud del intervalo de confianza).

Una idea de la varianza S2 de la distribución de la variable cuantitativa que se supone existe en la población.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl

Si la población es finita, es decir conocemos el total de la población y desearíamos saber cuantos del total tendríamos que estudiar, la respuesta sería:

6. Una de las dos formas de realizar inferencia estadística, es por medio de estimación de parámetros de una población. Explique las ventajas y desventajas de este método para inferir las características de una población.

Las ventajas que tiene utilizar la estimación como método para inferir estadísticamente algún aspecto de la vida cotidiana se describen a continuación:- Mayor facilidad de obtención de los datos y del estudio de los mismos.- El proceso de obtención de información en base a la muestra es mas sencillo que los oros métodos de estudio

La desventaja más grande que tiene la utilización del método de estimación, es la vulnerabilidad a diferentes errores que pueden llegar a entregar conclusiones equivocadas sobre la población objeto de estudio.

INFERENCIA ESTADISTICA

Page 8: Trabajo 1 Inferencia Estadistica [1]

7. El margen de error de una estimación es controlado por tres factores: Nivel de confianza, tamaño de la muestra y desviación estándar. Explique los criterios que tiene un investigador para su determinación en una investigación estadística.

Cualquier investigador tiene que empezar con una pregunta, ésta es la cuestión que se formula el investigador en relación al proyecto que pretende realizar. En lo referente al diseño, hay técnicas más o menos difíciles que se tendrán que aplicar. La pregunta es un proceso abierto a la intervención del investigador, no hay muchas reglas para la formulación de las mismas, tiene que ser un proceso intuitivo, creativo, esto es lo que diferencia una buena investigación de otra.

LA IDENTIFICACIÓN DEL TEMA A INVESTIGAR.

La pregunta tiene que estar muy delimitada, ser concreta, única y relevante, no debe ser ambigua. Hay que delimitar la pregunta fundamental para el estudio.

La pregunta ha de tener dos variables:·       Una como antecedente.·        Otra como consecuente.

Ha de describir a la población referida, es decir limitar la población.

CARACTERÍSTICAS.

¿Qué cosas debemos valorar?

·        El grado de interés que supone para el investigador, cuanto mayor sea este, mejor se llevara a efecto la investigación.·        El presupuesto económico ha de ser razonable, no pasarse ni de corto ni de largo.·        El grado de novedad de la pregunta. Es decir que se aporte algo diferente a lo que sabemos hasta el día de hoy, que intente resolver o dar solución a conclusiones sobre un tema que presenta contradicciones.·        REPLICACION, hallazgos en poblaciones o con variaciones en el método.·        UTILIDAD, relevancia práctica (criterio principal)·        UTILIDAD, relevancia teórica, de cara al desarrollo técnico de una disciplina. Incremento en el conocimiento conceptual y teórico.·        ETICA, hay que cuidar el aspecto ético del estudio. Si supone un daño para el paciente. Si ha de pasar anteriormente por un comité de ética. Los diseños de intervención son los que han de pasar previamente por un comité de ética.·        VIABILIDAD, examina hasta que punto esa pregunta es factible y las personas encargadas son capaces de hacerlo, es decir, tienen suficiente experiencia. El proyecto ha de ser factible, esto tiene que ver con la metodología.·        TAMAÑO. Número adecuado del tamaño de la muestra. Se debe considerar si el tamaño de la muestra es razonable y si es representativa y sí el investigador puede tener acceso a la muestra.·        EXPERIENCIA técnica adecuada. Solvencia de los investigadores. Ver su

INFERENCIA ESTADISTICA

Page 9: Trabajo 1 Inferencia Estadistica [1]

currículo. Equipo multidisciplinar.·        Abordable en cuanto a tiempo y dinero.·        Manejable en cuanto al alcance. Valorar si el equipo está en disposición de realizar el proyecto. Es la FACTIBILIDAD global del proyecto.

Formalmente la pregunta a investigar, puede formularse en forma interrogativa o bien enunciativa afirmativa, como paso previo, en un par de folios hay que enunciarla y delimitar las características del trabajo a estudio.

Previo al inicio del proyecto hay que elaborar:·        La pregunta.·        Bosquejo de la metodología. Hay que poner los antecedentes que nos han permitido llegar a la elaboración de la pregunta.·        La literatura, no solamente las nacionales, sino en la literatura mundial. Consulta a las fuentes de literatura y las bases de datos tanto nacionales como internacionales.·        Población que abarca.·        Aspectos concretos del estudio.·        Fuentes en las que nos vamos a basar para realizar el estudio, pueden ser:1.      Experiencias.2.      Documentación: lectura, hallazgos previos en la literatura.

PROBLEMAS MÁS FRECUENTES Y SUS POSIBLES SOLUCIONES:

1. - Que la pregunta sea difusa o inapropiada, si consultamos con expertos, nos va ayudar a delimitarla.

2. - Que no sea factible:

2.1. Demasiado amplia. Al investigador novato, le gusta contestar a muchas preguntas colaterales que dan lugar a subproyectos, como solución hay que procurar reducir el número de variables a dos.

2.2. Número de individuos insuficiente, como solución hay que aumentar los criterios de inclusión o eliminar los criterios de exclusión.

2.3. Método inadecuado o que supera la experiencia del investigador, como solución consultar a expertos y revisar la literatura buscando métodos alternativos. El equipo ha de tener solvencia. El investigador principal, no puede dominarlo todo, debe tener perspectiva amplia del proyecto y consultar con expertos.

2.4. Encauce del proyecto.·        Tamaño muestral.·        Técnicas de recogidas de datos.·        Ajustar para que sea financiable.·        Búsqueda de métodos de medición más baratos o búsqueda de fuentes de ingresos adicionales.

INFERENCIA ESTADISTICA

Page 10: Trabajo 1 Inferencia Estadistica [1]

3. - Si no es relevante: la mayoría de las preguntas no son novedosas ni relevantes aportando poco, en este caso se deberá modificar la pregunta.

4. - Si de ética dudosa consultar con el Comité de Ética.

8. Cuál es el criterio a seguir si queremos determinar un tamaño de muestra y no conocemos la varianza poblacional. Explique como se resuelve el problema.

Intervalo para la Media (Varianza desconocida)Si no se conoce la varianza s2 de la población, una posibilidad es utilizar la varianza muestral S2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocidaEste procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes.Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una distribución NormalSi la población es Normal, la siguiente estadística

Tiene una distribución t con N-1 grados de libertad

INFERENCIA ESTADISTICA

T=X

S/ N

T=X

S/ N

Page 11: Trabajo 1 Inferencia Estadistica [1]

de la figura: P{-ta/2,N-1 £ T £ ta/2,N-1 }=1-a. Con lo cual el intervalo de confianza del 100(1-a)% para la media es

9. Explique como se define la confiabilidad y cual es su interpretación en la Construcción de un intervalo de confianza. Presente un ejemplo.

La confiabilidad es la posibilidad de que el parámetro a estimar sea igual a un valor estimado (estimación puntual) o este en un rango de valores establecido (intervalos de confianza).

En la medida en que una estimación sea mas confiable, la probabilidad de que esta sea igual al parámetro obtenido en el ejercicio será mayor.

INFERENCIA ESTADISTICA

Page 12: Trabajo 1 Inferencia Estadistica [1]

10. Consulte los registros sobre las tarifas de un servicio público (agua, teléfono, Luz, gas, etc.), de por los menos 300 usuarios de estrato 3, de un barrio de en su ciudad de origen, en una empresa de servicios públicos: Determine la varianza de muestreo, con una muestra de 15 tarifas seleccionadas al azar, utilícela para calcular el tamaño de muestra necesario para estimar la media y el total de la población, con un error de $500 y una confianza de 99%. Obtenga con base en esta muestra (seleccionada con el muestreo aleatorio simple y sistemático), los intervalos de confianza para estos dos parámetros. Vuelva a calcular los valores de los dos parámetros (media y el total) con todos los datos de la población de tarifas consultadas. Compare los valores estimados con los valores reales y concluya: ¿qué tan buenas son las estimaciones realizadas por usted?, ¿están las estimaciones calculadas de acuerdo con los valores reales?

INFERENCIA ESTADISTICA

Page 13: Trabajo 1 Inferencia Estadistica [1]

INFERENCIA ESTADISTICA

58.048 40.365 35.194 27.072 28.26769.184 47.789 49.299 43.775 43.85773.345 50.563 54.571 50.018 49.68371.916 49.611 52.760 47.874 47.68277.915 53.610 60.359 56.873 56.08179.150 54.433 61.923 58.725 57.81067.500 46.666 47.166 41.249 41.49953.346 37.231 29.238 20.019 21.68467.546 46.697 47.225 41.319 41.56467.333 46.556 46.956 41.000 41.26753.108 37.072 28.936 19.662 21.35161.626 42.751 39.726 32.439 33.27678.705 54.137 61.360 58.058 57.18771.859 49.572 52.687 47.788 47.60267.114 46.409 46.678 40.671 40.95979.250 54.500 62.050 58.874 57.95056.536 39.358 33.279 24.804 26.15169.800 48.200 50.081 44.701 44.72164.829 44.886 43.783 37.243 37.76073.956 50.970 55.344 50.933 50.53856.756 39.504 33.557 25.134 26.45875.980 52.320 57.908 53.970 53.37279.718 54.812 62.643 59.577 58.60556.420 39.280 33.132 24.630 25.98857.930 40.287 35.045 26.895 28.10273.903 50.935 55.277 50.855 50.46470.709 48.806 51.232 46.064 45.99351.523 36.015 26.929 17.284 19.13264.332 44.555 43.154 36.498 37.06561.789 42.859 39.933 32.683 33.50474.795 51.530 56.407 52.193 51.71463.739 44.159 42.402 35.608 36.23469.468 47.979 49.660 44.202 44.25650.038 35.025 25.048 15.057 17.05367.588 46.725 47.278 41.382 41.62374.976 51.651 56.637 52.464 51.96752.348 36.565 27.974 18.522 20.28756.653 39.435 33.427 24.979 26.31458.251 40.500 35.451 27.376 28.55155.969 38.979 32.561 23.954 25.35779.288 54.525 62.098 58.932 58.00456.313 39.209 32.997 24.470 25.83976.539 52.693 58.616 54.809 54.15574.901 51.600 56.541 52.351 51.86154.813 38.209 31.096 22.220 23.73872.311 49.874 53.261 48.467 48.23674.286 51.191 55.763 51.429 51.00162.813 43.542 41.230 34.220 34.93878.412 53.941 60.989 57.618 56.77750.778 35.519 25.986 16.167 18.08968.725 47.483 48.718 43.087 43.21467.899 46.932 47.672 41.848 42.05861.349 42.566 39.376 32.024 32.88976.897 52.931 59.069 55.345 54.65659.239 41.160 36.703 28.859 29.93557.380 39.920 34.349 26.071 27.33356.125 39.083 32.758 24.187 25.57569.782 48.188 50.057 44.673 44.69578.737 54.158 61.400 58.105 57.23165.544 45.363 44.690 38.317 38.762

Page 14: Trabajo 1 Inferencia Estadistica [1]

Valores tomados de empresa de servicios públicos al azar de 300 casas.

Se seleccionan 15 muestras al azar

Así:

76.897 28.859 60.989 36.703 33.13268.725 44.690 50.057 26.929 70.70944.721 49.299 40.959 62.050 58.105

: Determine la varianza de muestreo, con una muestra de 15 tarifas seleccionadas al azar.

La media de estos 15 valores será:

Entonces la media será =752824 / 15 = 50188,26

Luego la Varianza sera:

Entonces la varianza será =

Calcular el tamaño de muestra necesario para estimar la media y el total de la población.

Con un error de $500 y una confianza de 99%. Obtenga con base en esta muestra (seleccionada con el muestreo aleatorio simple y sistemático), los intervalos de confianza para estos dos parámetros

. Vuelva a calcular los valores de los dos parámetros (media y el total) con todos los datos de la población de tarifas consultadas

. Compare los valores estimados con los valores reales y concluya

¿qué tan buenas son las estimaciones realizadas por usted?

¿están las estimaciones calculadas de acuerdo con los valores reales?

INFERENCIA ESTADISTICA

Page 15: Trabajo 1 Inferencia Estadistica [1]

CONCLUSIONES

De los aspectos tratados se ha analizado los distintos conceptos de lo que es población, muestra, entre otros y de ello es importante acotar que la población en una investigación es relativa y está en dependencia del campo de estudio a trabajar. Que siempre resulta imprescindible dejar bien definido cuál es la población a trabajar, porque de la misma es que será seleccionada la muestra, constituyendo ésta un subconjunto de la población y por consiguiente contendrá las mismas propiedades de la primera.

Cuando se selecciona la muestra se debe tratar de que esta selección se haga por el método aleatorio simple o estratificado, si es que de ella queremos realizar inferencias con relación a la población investigada.

INFERENCIA ESTADISTICA

Page 16: Trabajo 1 Inferencia Estadistica [1]

BIBLIOGRAFÍA

http://www.cesma.usb.ve/~giselle/FC1623/guiaestiicapituloIII.pdf

http://www.monografias.com/trabajos30/inferencia-estadistica/inferencia-estadistica.shtml

http://www.angelfire.com/un/uacj/bioesta.html

http://www.itch.edu.mx/academic/industrial/estadistica1/cap01.html

http://biplot.usal.es/problemas/confianza/INFERENCIA.pdf

INFERENCIA ESTADISTICA