Estadistica Inferencial
Embed Size (px)
description
Transcript of Estadistica Inferencial

Estadistica InferencialIntervalos de confianza y estimación confidencial
Técnicas de muestreoContrastes de Hipótesis
Prueba de Ji-Cuadrado (X²)Análisis de la varianza
Noviembre 2010Profa. Debbie FigueroaBioestadistica
1Profa. Debbie Figueroa Bioestadistica

…la selección de una técnica estadística apropiada la determina el diseño experimental, la hipótesis, y los datos recogidos
…son herramientas matemáticas que permiten al investigador generalizar a una población de individuos basándose en la información obtenida de un número limitado de participantes en la investigación

Objetivos de la Estadística InferencialEs el de hacer inferencias (predecir,
decidir) sobre algunas características de la población con base en la información contenida en una muestra.
•Determinar la confiabilidad de la inferencia de que los fenómenos observados en la muestra ocurrirán también en la población de donde se seleccionó la muestra.

PropósitoLa tarea fundamental de la
estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.
Ejemplo la relación entre fumar y el cáncer de pulmón.
4Profa. Debbie Figueroa Bioestadistica

Necesidades de la Estadística
Dominio de la estadística descriptiva.
Técnica de muestreo.Selección del estadístico de
prueba.Diferenciar entre las técnicas que
son válidas para el análisis de los datos cualitativos y de los datos cuantitativos.

Técnicas de muestreoLa teoría del muestreo tiene por
objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.
6Profa. Debbie Figueroa Bioestadistica

Tipos de Técnicas de Estadística Inferencial
En la estadística inferencial el investigador se encuentra con dos tipos de técnicas, las Paramétricas y las No Paramétricas.
–Las paramétricas: establecen una serie de supuestos acerca de la naturaleza de la población de la que se extrajo la muestra de estudio.
–Las no paramétricas: no requieren supuestos sobre las características de la población y facilitan más el análisis de datos nominales y ordinales.

VentajasLas ventajas de estudiar una
población a partir de sus muestras son Principalmente: ◦Coste reducido: Si los datos que
buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas
previas a un refer´endum, es m´as barato preguntar a 4,000 personas su intención de voto, que a 30,000,000;
8Profa. Debbie Figueroa Bioestadistica

Ventajas Mayor rapidez:
◦ Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más posibilidades: ◦ Para hacer cierto tipo de estudios, por ejemplo
el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás. 9
Profa. Debbie Figueroa Bioestadistica

ProblemasElección de la muestra (muestreo),
◦muestreo aleatorio - en el que todos los elementos de la población tienen la misma probabilidad de ser extraídos sin reposición de los elementos; con reposición.
Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).
10Profa. Debbie Figueroa Bioestadistica

Técnicas Paramétricas Son más potentes que las no
paramétricas y por consiguiente las inferencias que se realizan son más fiables.
El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramétrico, sobre todo en investigaciones educativas y sociales.

Técnicas No Paramétricas Son fáciles de utilizar y algunas son tan
potentes como las paramétricas.
El análisis de datos cualitativos ha generado técnicas propias, que actualmente constituyen toda una metodología específica que viene marcada por la propia idiosincrasia cualitativa y que toma determinadas opciones en relación a las unidades del registro de los datos y la forma de tratarlos.

La lógica de la prueba de hipótesis En el proceso de la estadística
inferencial, hay dos tipos de hipótesis claves:◦La hipótesis nula (H0), se construye
artificialmente para que el investigador evalúe su hipótesis de investigación. Plantea que no existe relación entre los dos fenómenos.
◦La hipótesis de alterna (H1), que simplemente señala la existencia de un hecho o de un evento, o la relación entre dos o más fenómenos.

Pasos para probar hipótesis
1° Planteamiento.2° Anticipar los eventos que pueden
resultar a partir de la observación o experimentación.
3° Especificar las condiciones bajo las cuales la hipótesis se puede rechazar o aceptar.
4° Realizar el experimento y la observación y que se analice el evento o resultado.
5° Toma de decisión de rechazar o aceptar la hipótesis.

Pasos para verificar la hipótesis
1° Aclarar la hipótesis de investigación H1 y crear la hipótesis nula H0.
2° Obtener la distribución del muestreo.
3° Seleccionar un nivel de significancia y una región de rechazo.
4° Hacer la prueba estadística.5° Comparar y concluir.

Posibilidades de la Prueba de Hipótesis

Errores y Poder Tipo I: Es la probabilidad de rechazar la
hipótesis nula, cuando Ho es cierta.◦Esta probabilidad es comúnmente denotada
por la letra α, conocido también como el nivel de significancia.
Tipo II: Es la probabilidad de no rechazar la hipótesis nula cuando H1 es cierta.◦Esta probabilidad es comúnmente denotada
por la letra β.El poder de la prueba es definido como:
◦1-β=1-probabilidad de error tipo II◦Pr (rechazar Ho | H1 cierta)

Muestreo aleatorioMuestreo aleatorio sin reposición
◦Consideremos una población E formada por N elementos. Si observamos un elemento particular, e pertence a E, en un muestreo aleatorio sin reposición se da la siguiente circunstancia:
18Profa. Debbie Figueroa Bioestadistica

Con reposición◦Sobre una población E de tamaño N
podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces.
19Profa. Debbie Figueroa Bioestadistica

Muestreo sistemáticoCuando los elementos de la
población están ordenados en fichas o en una lista, una manera de muestrear consiste en:
20Profa. Debbie Figueroa Bioestadistica

Muestreo por conglomerados Si intentamos hacer un estudio sobre los
habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamáño n implica enviar a los encuestadores a n puntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza una entrevista.
En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
21Profa. Debbie Figueroa Bioestadistica

Estimación Proceso de estimar el valor de un
parámetro de la información obtenida de una muestra.
Ejemplos: “Una enfermera graduada gana
un promedio de $32,786 anuales” (National Assoc. of School Nurses)
“Uno de 4 americanos hace dieta” (Calorie Control Council)
22Profa. Debbie Figueroa Bioestadistica

Estimación Confidencial
23Profa. Debbie Figueroa Bioestadistica

Intervalos de confianza para la media (σ conocida o n>30) y muestreo
Estimado de punto ◦Un valor numérico específico
estimado de un parámetro. El mejor estimado de punto de la media de una población (µ), es la media de la muestra (X).
24Profa. Debbie Figueroa Bioestadistica

Intervalos de confianza Estimado de intervalo
◦ De un parámetro es u intervalo o un rango de valores utilizados para estimar un parámetro. El estimado puede o no contener el valor del parámetro siendo estimado.
Nivel de confianza ◦ Es la probabilidad de que el estimado del intervalo
contenga el parámetro, asumiendo que un gran numero de muestras sean seleccionadas y que el proceso de estimación en el mismo parámetro sea repetido.
Intervalo de confianza◦ Un intervalo especifico de un parámetro
determinado por el uso de datos obtenidos de una muestra y utilizando un nivel de confianza especifico del estimado. 25
Profa. Debbie Figueroa Bioestadistica

Intervalos de confianza
26Profa. Debbie Figueroa Bioestadistica

Intervalos de confianza para la media (σ conocida o n>30) y muestreo
Para un intervalo de confianza de 90%
zα/2 = 1.65Para un intervalo de confianza de
95%zα/2 = 1.96
Para un intervalo de confianza de 99%
zα/2 = 2.58zα/2 = Error máximo estimado
27Profa. Debbie Figueroa Bioestadistica

Intervalo de conf al 95%
28Profa. Debbie Figueroa Bioestadistica

EjemploEn una encuesta a 30 adultos se
encontró que la edad media de un vehiculo primario de una persona es de 5.6 años. Asumiendo que la desviacion estandar de la poblacion es 0.8 años, encuentre el mejor punto estimado de la media de la poblacion y el 99% intervalo de confianza de la media de la poblacion. 29
Profa. Debbie Figueroa Bioestadistica

SoluciónDado a que la media poblacional
es 5.6 años.5.6 – 2.58 (0.8/√30) < µ < 5.6 + 2.58
(0.8/√30) 5.6 – 0.38 < µ < 5.6 – 0.38
5.22 < µ < 5.985.2 < µ < 6.00 (redondeado)
Uno puede estar confiado en un 99% en que la vida promedio de un vehículo primario esta entre 5.2 y 6.0 años, basado en 30 vehículos. 30
Profa. Debbie Figueroa Bioestadistica

Estimación del tamaño de muestra
E= zα/2(σ/√n) = E√n = zα/2(σ) = √n = [zα/2(σ)]/E
n = {[zα/2(σ)]/E }2
31Profa. Debbie Figueroa Bioestadistica

Ejemplo
En los últimos ejemplos se ha estudiado la variable altura de los individuos de una población, considerando que ésta es una variable que se distribuye de modo normal o gaussiana.
Para ello se tomó una muestra de 25 individuos (que podemos considerar piloto), que ofreció los siguientes resultados:
Calcular el tamaño que debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel d significación = 0, 01 (al 99 %) y con una precisión de d = 1 cm. 32
Profa. Debbie Figueroa Bioestadistica

Solución
33Profa. Debbie Figueroa Bioestadistica

INFERENCIA (PRUEBAS PARAMÉTRICAS)
34Profa. Debbie Figueroa Bioestadistica

Contrastes de hipótesisImplica, en cualquier
investigación, la existencia de dos teorías o hipótesis implícitas, que denominaremos hipótesis nula e hipótesis alternativa, que de alguna manera reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la “realidad”.
35Profa. Debbie Figueroa Bioestadistica

Contrastes
36Profa. Debbie Figueroa Bioestadistica

Ejemplo
37Profa. Debbie Figueroa Bioestadistica

Solución
38Profa. Debbie Figueroa Bioestadistica

Como hacer un test de hipótesis
39Profa. Debbie Figueroa Bioestadistica

ErroresError tipo I
Error tipo II
40Profa. Debbie Figueroa Bioestadistica

Observaciones
41Profa. Debbie Figueroa Bioestadistica

Ejemplo
42Profa. Debbie Figueroa Bioestadistica