Estadistica Inferencial

42
Estadistica Inferencial Intervalos de confianza y estimación confidencial Técnicas de muestreo Contrastes de Hipótesis Prueba de Ji-Cuadrado (X²) Análisis de la varianza Noviembre 2010 Profa. Debbie Figueroa Bioestadistica 1 Profa. Debbie Figueroa Bioestadistica

description

presentacion del 16 de nov

Transcript of Estadistica Inferencial

Page 1: Estadistica Inferencial

Estadistica InferencialIntervalos de confianza y estimación confidencial

Técnicas de muestreoContrastes de Hipótesis

Prueba de Ji-Cuadrado (X²)Análisis de la varianza

Noviembre 2010Profa. Debbie FigueroaBioestadistica

1Profa. Debbie Figueroa Bioestadistica

Page 2: Estadistica Inferencial

…la selección de una técnica estadística apropiada la determina el diseño experimental, la hipótesis, y los datos recogidos

…son herramientas matemáticas que permiten al investigador generalizar a una población de individuos basándose en la información obtenida de un número limitado de participantes en la investigación

Page 3: Estadistica Inferencial

Objetivos de la Estadística InferencialEs el de hacer inferencias (predecir,

decidir) sobre algunas características de la población con base en la información contenida en una muestra.

•Determinar la confiabilidad de la inferencia de que los fenómenos observados en la muestra ocurrirán también en la población de donde se seleccionó la muestra.

Page 4: Estadistica Inferencial

PropósitoLa tarea fundamental de la

estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.

Ejemplo la relación entre fumar y el cáncer de pulmón.

4Profa. Debbie Figueroa Bioestadistica

Page 5: Estadistica Inferencial

Necesidades de la Estadística

Dominio de la estadística descriptiva.

Técnica de muestreo.Selección del estadístico de

prueba.Diferenciar entre las técnicas que

son válidas para el análisis de los datos cualitativos y de los datos cuantitativos.

Page 6: Estadistica Inferencial

Técnicas de muestreoLa teoría del muestreo tiene por

objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.

6Profa. Debbie Figueroa Bioestadistica

Page 7: Estadistica Inferencial

Tipos de Técnicas de Estadística Inferencial

En la estadística inferencial el investigador se encuentra con dos tipos de técnicas, las Paramétricas y las No Paramétricas.

–Las paramétricas: establecen una serie de supuestos acerca de la naturaleza de la población de la que se extrajo la muestra de estudio.

–Las no paramétricas: no requieren supuestos sobre las características de la población y facilitan más el análisis de datos nominales y ordinales.

Page 8: Estadistica Inferencial

VentajasLas ventajas de estudiar una

población a partir de sus muestras son Principalmente: ◦Coste reducido: Si los datos que

buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas

previas a un refer´endum, es m´as barato preguntar a 4,000 personas su intención de voto, que a 30,000,000;

8Profa. Debbie Figueroa Bioestadistica

Page 9: Estadistica Inferencial

Ventajas Mayor rapidez:

◦ Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

Más posibilidades: ◦ Para hacer cierto tipo de estudios, por ejemplo

el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás. 9

Profa. Debbie Figueroa Bioestadistica

Page 10: Estadistica Inferencial

ProblemasElección de la muestra (muestreo),

◦muestreo aleatorio - en el que todos los elementos de la población tienen la misma probabilidad de ser extraídos sin reposición de los elementos; con reposición.

Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).

10Profa. Debbie Figueroa Bioestadistica

Page 11: Estadistica Inferencial

Técnicas Paramétricas Son más potentes que las no

paramétricas y por consiguiente las inferencias que se realizan son más fiables.

El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramétrico, sobre todo en investigaciones educativas y sociales.

Page 12: Estadistica Inferencial

Técnicas No Paramétricas Son fáciles de utilizar y algunas son tan

potentes como las paramétricas.

El análisis de datos cualitativos ha generado técnicas propias, que actualmente constituyen toda una metodología específica que viene marcada por la propia idiosincrasia cualitativa y que toma determinadas opciones en relación a las unidades del registro de los datos y la forma de tratarlos.

Page 13: Estadistica Inferencial

La lógica de la prueba de hipótesis En el proceso de la estadística

inferencial, hay dos tipos de hipótesis claves:◦La hipótesis nula (H0), se construye

artificialmente para que el investigador evalúe su hipótesis de investigación. Plantea que no existe relación entre los dos fenómenos.

◦La hipótesis de alterna (H1), que simplemente señala la existencia de un hecho o de un evento, o la relación entre dos o más fenómenos.

Page 14: Estadistica Inferencial

Pasos para probar hipótesis

1° Planteamiento.2° Anticipar los eventos que pueden

resultar a partir de la observación o experimentación.

3° Especificar las condiciones bajo las cuales la hipótesis se puede rechazar o aceptar.

4° Realizar el experimento y la observación y que se analice el evento o resultado.

5° Toma de decisión de rechazar o aceptar la hipótesis.

Page 15: Estadistica Inferencial

Pasos para verificar la hipótesis

1° Aclarar la hipótesis de investigación H1 y crear la hipótesis nula H0.

2° Obtener la distribución del muestreo.

3° Seleccionar un nivel de significancia y una región de rechazo.

4° Hacer la prueba estadística.5° Comparar y concluir.

Page 16: Estadistica Inferencial

Posibilidades de la Prueba de Hipótesis

Page 17: Estadistica Inferencial

Errores y Poder Tipo I: Es la probabilidad de rechazar la

hipótesis nula, cuando Ho es cierta.◦Esta probabilidad es comúnmente denotada

por la letra α, conocido también como el nivel de significancia.

Tipo II: Es la probabilidad de no rechazar la hipótesis nula cuando H1 es cierta.◦Esta probabilidad es comúnmente denotada

por la letra β.El poder de la prueba es definido como:

◦1-β=1-probabilidad de error tipo II◦Pr (rechazar Ho | H1 cierta)

Page 18: Estadistica Inferencial

Muestreo aleatorioMuestreo aleatorio sin reposición

◦Consideremos una población E formada por N elementos. Si observamos un elemento particular, e pertence a E, en un muestreo aleatorio sin reposición se da la siguiente circunstancia:

18Profa. Debbie Figueroa Bioestadistica

Page 19: Estadistica Inferencial

Con reposición◦Sobre una población E de tamaño N

podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces.

19Profa. Debbie Figueroa Bioestadistica

Page 20: Estadistica Inferencial

Muestreo sistemáticoCuando los elementos de la

población están ordenados en fichas o en una lista, una manera de muestrear consiste en:

20Profa. Debbie Figueroa Bioestadistica

Page 21: Estadistica Inferencial

Muestreo por conglomerados Si intentamos hacer un estudio sobre los

habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamáño n implica enviar a los encuestadores a n puntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza una entrevista.

En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.

21Profa. Debbie Figueroa Bioestadistica

Page 22: Estadistica Inferencial

Estimación Proceso de estimar el valor de un

parámetro de la información obtenida de una muestra.

Ejemplos: “Una enfermera graduada gana

un promedio de $32,786 anuales” (National Assoc. of School Nurses)

“Uno de 4 americanos hace dieta” (Calorie Control Council)

22Profa. Debbie Figueroa Bioestadistica

Page 23: Estadistica Inferencial

Estimación Confidencial

23Profa. Debbie Figueroa Bioestadistica

Page 24: Estadistica Inferencial

Intervalos de confianza para la media (σ conocida o n>30) y muestreo

Estimado de punto ◦Un valor numérico específico

estimado de un parámetro. El mejor estimado de punto de la media de una población (µ), es la media de la muestra (X).

24Profa. Debbie Figueroa Bioestadistica

Page 25: Estadistica Inferencial

Intervalos de confianza Estimado de intervalo

◦ De un parámetro es u intervalo o un rango de valores utilizados para estimar un parámetro. El estimado puede o no contener el valor del parámetro siendo estimado.

Nivel de confianza ◦ Es la probabilidad de que el estimado del intervalo

contenga el parámetro, asumiendo que un gran numero de muestras sean seleccionadas y que el proceso de estimación en el mismo parámetro sea repetido.

Intervalo de confianza◦ Un intervalo especifico de un parámetro

determinado por el uso de datos obtenidos de una muestra y utilizando un nivel de confianza especifico del estimado. 25

Profa. Debbie Figueroa Bioestadistica

Page 26: Estadistica Inferencial

Intervalos de confianza

26Profa. Debbie Figueroa Bioestadistica

Page 27: Estadistica Inferencial

Intervalos de confianza para la media (σ conocida o n>30) y muestreo

Para un intervalo de confianza de 90%

zα/2 = 1.65Para un intervalo de confianza de

95%zα/2 = 1.96

Para un intervalo de confianza de 99%

zα/2 = 2.58zα/2 = Error máximo estimado

27Profa. Debbie Figueroa Bioestadistica

Page 28: Estadistica Inferencial

Intervalo de conf al 95%

28Profa. Debbie Figueroa Bioestadistica

Page 29: Estadistica Inferencial

EjemploEn una encuesta a 30 adultos se

encontró que la edad media de un vehiculo primario de una persona es de 5.6 años. Asumiendo que la desviacion estandar de la poblacion es 0.8 años, encuentre el mejor punto estimado de la media de la poblacion y el 99% intervalo de confianza de la media de la poblacion. 29

Profa. Debbie Figueroa Bioestadistica

Page 30: Estadistica Inferencial

SoluciónDado a que la media poblacional

es 5.6 años.5.6 – 2.58 (0.8/√30) < µ < 5.6 + 2.58

(0.8/√30) 5.6 – 0.38 < µ < 5.6 – 0.38

5.22 < µ < 5.985.2 < µ < 6.00 (redondeado)

Uno puede estar confiado en un 99% en que la vida promedio de un vehículo primario esta entre 5.2 y 6.0 años, basado en 30 vehículos. 30

Profa. Debbie Figueroa Bioestadistica

Page 31: Estadistica Inferencial

Estimación del tamaño de muestra

E= zα/2(σ/√n) = E√n = zα/2(σ) = √n = [zα/2(σ)]/E

n = {[zα/2(σ)]/E }2

31Profa. Debbie Figueroa Bioestadistica

Page 32: Estadistica Inferencial

Ejemplo

En los últimos ejemplos se ha estudiado la variable altura de los individuos de una población, considerando que ésta es una variable que se distribuye de modo normal o gaussiana.

Para ello se tomó una muestra de 25 individuos (que podemos considerar piloto), que ofreció los siguientes resultados:

Calcular el tamaño que debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel d significación = 0, 01 (al 99 %) y con una precisión de d = 1 cm. 32

Profa. Debbie Figueroa Bioestadistica

Page 33: Estadistica Inferencial

Solución

33Profa. Debbie Figueroa Bioestadistica

Page 34: Estadistica Inferencial

INFERENCIA (PRUEBAS PARAMÉTRICAS)

34Profa. Debbie Figueroa Bioestadistica

Page 35: Estadistica Inferencial

Contrastes de hipótesisImplica, en cualquier

investigación, la existencia de dos teorías o hipótesis implícitas, que denominaremos hipótesis nula e hipótesis alternativa, que de alguna manera reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la “realidad”.

35Profa. Debbie Figueroa Bioestadistica

Page 36: Estadistica Inferencial

Contrastes

36Profa. Debbie Figueroa Bioestadistica

Page 37: Estadistica Inferencial

Ejemplo

37Profa. Debbie Figueroa Bioestadistica

Page 38: Estadistica Inferencial

Solución

38Profa. Debbie Figueroa Bioestadistica

Page 39: Estadistica Inferencial

Como hacer un test de hipótesis

39Profa. Debbie Figueroa Bioestadistica

Page 40: Estadistica Inferencial

ErroresError tipo I

Error tipo II

40Profa. Debbie Figueroa Bioestadistica

Page 41: Estadistica Inferencial

Observaciones

41Profa. Debbie Figueroa Bioestadistica

Page 42: Estadistica Inferencial

Ejemplo

42Profa. Debbie Figueroa Bioestadistica