Estadistica Inferencial

Estadistica InferencialIntervalos de confianza y estimación confidencial

Técnicas de muestreoContrastes de Hipótesis

Prueba de Ji-Cuadrado (X²)Análisis de la varianza

Noviembre 2010Profa. Debbie FigueroaBioestadistica

1Profa. Debbie Figueroa Bioestadistica

…la selección de una técnica estadística apropiada la determina el diseño experimental, la hipótesis, y los datos recogidos

…son herramientas matemáticas que permiten al investigador generalizar a una población de individuos basándose en la información obtenida de un número limitado de participantes en la investigación

Objetivos de la Estadística InferencialEs el de hacer inferencias (predecir,

decidir) sobre algunas características de la población con base en la información contenida en una muestra.

•Determinar la confiabilidad de la inferencia de que los fenómenos observados en la muestra ocurrirán también en la población de donde se seleccionó la muestra.

PropósitoLa tarea fundamental de la

estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma.

Ejemplo la relación entre fumar y el cáncer de pulmón.


Necesidades de la Estadística

Dominio de la estadística descriptiva.

Técnica de muestreo.Selección del estadístico de

prueba.Diferenciar entre las técnicas que

son válidas para el análisis de los datos cualitativos y de los datos cuantitativos.

Técnicas de muestreoLa teoría del muestreo tiene por

objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.


Tipos de Técnicas de Estadística Inferencial

En la estadística inferencial el investigador se encuentra con dos tipos de técnicas, las Paramétricas y las No Paramétricas.

–Las paramétricas: establecen una serie de supuestos acerca de la naturaleza de la población de la que se extrajo la muestra de estudio.

–Las no paramétricas: no requieren supuestos sobre las características de la población y facilitan más el análisis de datos nominales y ordinales.

VentajasLas ventajas de estudiar una

población a partir de sus muestras son Principalmente: ◦Coste reducido: Si los datos que

buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas

previas a un refer´endum, es m´as barato preguntar a 4,000 personas su intención de voto, que a 30,000,000;


Ventajas Mayor rapidez:

◦ Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

Más posibilidades: ◦ Para hacer cierto tipo de estudios, por ejemplo

el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás. 9

Profa. Debbie Figueroa Bioestadistica

ProblemasElección de la muestra (muestreo),

◦muestreo aleatorio - en el que todos los elementos de la población tienen la misma probabilidad de ser extraídos sin reposición de los elementos; con reposición.

Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).


Técnicas Paramétricas Son más potentes que las no

paramétricas y por consiguiente las inferencias que se realizan son más fiables.

El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramétrico, sobre todo en investigaciones educativas y sociales.

Técnicas No Paramétricas Son fáciles de utilizar y algunas son tan

potentes como las paramétricas.

El análisis de datos cualitativos ha generado técnicas propias, que actualmente constituyen toda una metodología específica que viene marcada por la propia idiosincrasia cualitativa y que toma determinadas opciones en relación a las unidades del registro de los datos y la forma de tratarlos.

La lógica de la prueba de hipótesis En el proceso de la estadística

inferencial, hay dos tipos de hipótesis claves:◦La hipótesis nula (H0), se construye

artificialmente para que el investigador evalúe su hipótesis de investigación. Plantea que no existe relación entre los dos fenómenos.

◦La hipótesis de alterna (H1), que simplemente señala la existencia de un hecho o de un evento, o la relación entre dos o más fenómenos.

Pasos para probar hipótesis

1° Planteamiento.2° Anticipar los eventos que pueden

resultar a partir de la observación o experimentación.

3° Especificar las condiciones bajo las cuales la hipótesis se puede rechazar o aceptar.

4° Realizar el experimento y la observación y que se analice el evento o resultado.

5° Toma de decisión de rechazar o aceptar la hipótesis.

Pasos para verificar la hipótesis

1° Aclarar la hipótesis de investigación H1 y crear la hipótesis nula H0.

2° Obtener la distribución del muestreo.

3° Seleccionar un nivel de significancia y una región de rechazo.

4° Hacer la prueba estadística.5° Comparar y concluir.

Posibilidades de la Prueba de Hipótesis

Errores y Poder Tipo I: Es la probabilidad de rechazar la

hipótesis nula, cuando Ho es cierta.◦Esta probabilidad es comúnmente denotada

por la letra α, conocido también como el nivel de significancia.

Tipo II: Es la probabilidad de no rechazar la hipótesis nula cuando H1 es cierta.◦Esta probabilidad es comúnmente denotada

por la letra β.El poder de la prueba es definido como:

◦1-β=1-probabilidad de error tipo II◦Pr (rechazar Ho | H1 cierta)

Muestreo aleatorioMuestreo aleatorio sin reposición

◦Consideremos una población E formada por N elementos. Si observamos un elemento particular, e pertence a E, en un muestreo aleatorio sin reposición se da la siguiente circunstancia:


Con reposición◦Sobre una población E de tamaño N

podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces.


Muestreo sistemáticoCuando los elementos de la

población están ordenados en fichas o en una lista, una manera de muestrear consiste en:


Muestreo por conglomerados Si intentamos hacer un estudio sobre los

habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamáño n implica enviar a los encuestadores a n puntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza una entrevista.

En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.


Estimación Proceso de estimar el valor de un

parámetro de la información obtenida de una muestra.

Ejemplos: “Una enfermera graduada gana

un promedio de $32,786 anuales” (National Assoc. of School Nurses)

“Uno de 4 americanos hace dieta” (Calorie Control Council)


Estimación Confidencial


Intervalos de confianza para la media (σ conocida o n>30) y muestreo

Estimado de punto ◦Un valor numérico específico

estimado de un parámetro. El mejor estimado de punto de la media de una población (µ), es la media de la muestra (X).


Intervalos de confianza Estimado de intervalo

◦ De un parámetro es u intervalo o un rango de valores utilizados para estimar un parámetro. El estimado puede o no contener el valor del parámetro siendo estimado.

Nivel de confianza ◦ Es la probabilidad de que el estimado del intervalo

contenga el parámetro, asumiendo que un gran numero de muestras sean seleccionadas y que el proceso de estimación en el mismo parámetro sea repetido.

Intervalo de confianza◦ Un intervalo especifico de un parámetro

determinado por el uso de datos obtenidos de una muestra y utilizando un nivel de confianza especifico del estimado. 25


Intervalos de confianza


Intervalos de confianza para la media (σ conocida o n>30) y muestreo

Para un intervalo de confianza de 90%

zα/2 = 1.65Para un intervalo de confianza de

95%zα/2 = 1.96

Para un intervalo de confianza de 99%

zα/2 = 2.58zα/2 = Error máximo estimado


Intervalo de conf al 95%


EjemploEn una encuesta a 30 adultos se

encontró que la edad media de un vehiculo primario de una persona es de 5.6 años. Asumiendo que la desviacion estandar de la poblacion es 0.8 años, encuentre el mejor punto estimado de la media de la poblacion y el 99% intervalo de confianza de la media de la poblacion. 29


SoluciónDado a que la media poblacional

es 5.6 años.5.6 – 2.58 (0.8/√30) < µ < 5.6 + 2.58

(0.8/√30) 5.6 – 0.38 < µ < 5.6 – 0.38

5.22 < µ < 5.985.2 < µ < 6.00 (redondeado)

Uno puede estar confiado en un 99% en que la vida promedio de un vehículo primario esta entre 5.2 y 6.0 años, basado en 30 vehículos. 30


Estimación del tamaño de muestra

E= zα/2(σ/√n) = E√n = zα/2(σ) = √n = [zα/2(σ)]/E

n = {[zα/2(σ)]/E }2


Ejemplo

En los últimos ejemplos se ha estudiado la variable altura de los individuos de una población, considerando que ésta es una variable que se distribuye de modo normal o gaussiana.

Para ello se tomó una muestra de 25 individuos (que podemos considerar piloto), que ofreció los siguientes resultados:

Calcular el tamaño que debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel d significación = 0, 01 (al 99 %) y con una precisión de d = 1 cm. 32


Solución


INFERENCIA (PRUEBAS PARAMÉTRICAS)


Contrastes de hipótesisImplica, en cualquier

investigación, la existencia de dos teorías o hipótesis implícitas, que denominaremos hipótesis nula e hipótesis alternativa, que de alguna manera reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la “realidad”.


Contrastes


Ejemplo


Solución


Como hacer un test de hipótesis


ErroresError tipo I

Error tipo II


Observaciones


Ejemplo


Estadistica Inferencial

Documents

Transcript of Estadistica Inferencial