Intervalos de confianza-1

26
INFERENCIA ESTADÍSTICA La Inferencia Estadística comprende los métodos que son usados para obtener conclusiones acerca de la población en base a una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis. M P obtención de la muestra conclusion es

Transcript of Intervalos de confianza-1

Page 1: Intervalos de confianza-1

INFERENCIA ESTADÍSTICA

La Inferencia Estadística comprende los métodos que son usados para obtener conclusiones acerca de la población en base a una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis.

MMP obtención de

la muestra

conclusiones

Page 2: Intervalos de confianza-1

Problema de estimación:¿Por qué una encuesta de 1500 personas permite predecir bastante bien el resultado de una elección con 10 millones de votantes? ¿Cómo se consigue? ¿Cómo se mide la precisión del resultado?

Problema de test de hipótesis:Las normas de calidad exigen que, en un lote de 5000 bombillas, a lo sumo el 3% pueden durar menos de 1000 horas. En un estudio de control de calidad de una fabrica de bombillas sería muy costoso examinar cada una. Se decide usar una muestra de 500 bombillas. Si obtenemos el 3,2% de bombillas defectuosas, ¿deberíamos declarar el lote completo defectuoso?

Page 3: Intervalos de confianza-1

Estimar la duración promedio de las bombillas del lote de 5000, a partir de una muestra de 500.

Problema de estimación

Se busca precisar una característica totalmente desconocida de la población a partir de los datos obtenidos sobre una muestra.

Estimar el porcentaje de la población (10 millones) que votó a JP a partir de una muestra de 1500 votantes.

Page 4: Intervalos de confianza-1

Problema de test de hipótesis

Se busca comprobar alguna información sobre la población a partir de los datos obtenidos de una muestra.

JP obtiene más del 65% de los votos.

Menos del 3% de las bombillas del lote de 5000 duran menos de 1000 horas.

Las bombillas duran más de 1000 horas en promedio.

Page 5: Intervalos de confianza-1

Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra.

Sea un estadístico (función de la muestra) que utilizamos para estimar el valor de .

El estadístico:

es una función que depende de la muestra y lo llamaremos estimador. El valor concreto de es la estimación.

),...,,(ˆ21 nXXXT

Problema de estimación

Page 6: Intervalos de confianza-1

Estimación Puntual: Se estudian los diversos métodos de encontrar estimadores y las propiedades óptimas que deben tener éstos.

Estimación de parámetros

Estimaciónpuntual

por intervalos

Estimación por Intervalos de Confianza: se estima un parámetro usando un intervalo centrado en un estimado del parámetro.

Page 7: Intervalos de confianza-1

Estimación puntual

Provee un solo valor, un valor concreto para la estimación.Un estimador puntual es simplemente un estadístico (media aritmética, varianza, etc.) que se emplea para estimar parámetros (media poblacional, varianza poblacional, etc.). Por ejemplo, cuando obtenemos una media aritmética a partir de una muestra, tal valor puede ser empleado como una estimación para el valor de la media poblacional.

Page 8: Intervalos de confianza-1
Page 9: Intervalos de confianza-1

Métodos de estimación puntual

Método de máxima verosimilitud

Hemos visto que un estimador de la media poblacional es la media muestral y de la varianza poblacional es la varianza muestral.

0,0)1(

)( 1

x

xxf ¿Cómo estimar

el parámetro θ?

Por ejemplo, supongamos una población con función densidad:

¿cómo determinar un estimador cuando no se trata de la media o la varianza?

Método de los momentos

Método de mínimos cuadrados

Page 10: Intervalos de confianza-1

No se espera que estime exactamente a sino que en realidad se espera que no esté muy alejado.

~ Propiedades de los estimadores

1.Ausencia de sesgo (Insesgadez)

2.Consistencia

3.Eficiencia

Entre 2 o más estimadores del mismo parámetro ¿cuál es el mejor estimador?

Page 11: Intervalos de confianza-1

Diremos que es un estimador insesgado de si:

nXXTEE ,...,ˆ

1

ˆ)( Eb se llama sesgo de

Estimador insesgado

La media muestral es un estimador insesgado de la media poblacional.

La varianza muestral (dividida por n) no es un estimador insesgado de la varianza poblacional, es sesgado.

Page 12: Intervalos de confianza-1

Sea una población N(, ) y sean los estimadores de varianza: varianza muestral y la varianza muestral (partida por n).

n

jj xx

nS

1

222 )(

1

1

n

jj xx

ns

1

221 )(

1

Si la población es normal, entonces el estimador:

212 como distribuye se

)1( 2

nSn

sesgo

nnn

Enn

E

En

sEE n

222

2]

21

2

1]ˆ[

1]ˆ[

[1

][]ˆ[

21

2*2

22 )( SE

Page 13: Intervalos de confianza-1

Propiedades en muestras grandesMuchos estimadores no tienen buenas

propiedades para muestras pequeñas, pero cuando el tamaño muestral aumenta, muchas de las propiedades deseables pueden cumplirse. En esta situación se habla de propiedades asintóticas de los estimadores.

Como el estimador va a depender del tamaño de la muestra vamos a expresarlo utilizando el símbolo

Por ejemplo, el sesgo puede depender del tamaño de la muestra. Si el sesgo tiende a cero cuando el tamaño de la muestra crece hasta infinito decimos que el estimador es asintóticamente insesgado.

n

Page 14: Intervalos de confianza-1

n

]ˆ[lim nnE

0]]ˆ[[lim

nn

E

Asintóticamente insesgadoDefinición: Un estimador se dice que es asintóticamente insesgado si

o equivalentemente:

Page 15: Intervalos de confianza-1

Se dice que un estimador es consistente si se cumple que

Tanto la media muestral como la varianza muestral son estimadores consistentes. La varianza muestral (partida por n) es un estimador consistente de la varianza poblacional, dado que a medida que el tamaño muestral se incrementa, el sesgo disminuye.

1ˆlim

nnP

]ˆ[ nE 0]ˆ[ nVar

o 1ˆlim

nnP

Consistencia

Es decir, a medida que se incrementa el tamaño muestral, el estimador se acerca más y más al valor del parámetro. La “consistencia” es una propiedad asintótica.

Page 16: Intervalos de confianza-1

Ejemplo: supongamos que la población es no normal y de media desconocida.

Para cada tamaño muestral n tenemos:

)( nxE nVar nx

2

)(

La media muestral es un estimador consistente de la media poblacional.

Page 17: Intervalos de confianza-1

~ˆ VarVar

Si , decimos que es un estimador insesgado eficiente o de varianza mínima para , si cualquier otro estimador insesgado de , digamos , verifica que:

ˆE

~

Menor varianza implica mayor precisión y entonces el estimador que tenga menor varianza es claramente más deseable porque, en promedio, está mas cerca del verdadero valor de .

Eficiencia

La varianza de una variable aleatoria mide la dispersión alrededor de la media.

Menor varianza para una variable aleatoria significa que, en promedio, sus valores fluctúan poco alrededor de la media comparados con los valores de otra variable aleatoria con la misma media y mayor varianza.

Page 18: Intervalos de confianza-1

Este método determina dos valores (límites de confianza) entre los que se acepta que puede estar el valor del estimador.

Estimación por intervalo

UL ˆˆ Muestra

1ˆˆULP 10

Tenemos entonces una probabilidad de 1-α de seleccionar una variable aleatoria que produzca un intervalo que contenga al parámetro.

El intervalo que se calcula a partir de la muestra seleccionada;

UL ˆˆ se llama intervalo de confianza de (1–) 100%

Page 19: Intervalos de confianza-1

Estimación por intervalo

1 nivel o grado de confianza

probabilidad de error (riesgo)

Tenemos entonces una probabilidad α de seleccionar una variable aleatoria que produzca un intervalo que no contenga al parámetro.

En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α.

En todo intervalo de confianza hay una noticia buena y otra mala:

La buena: hemos usado una técnica que en % alto de casos acierta.La mala: no sabemos si ha acertado en nuestro caso.

Page 20: Intervalos de confianza-1

De una población normal con media desconocida y varianza conocida 2 se extrae una muestra de tamaño n, entonces de la distribución de la media muestral se obtiene que:

n

Zx

1)( 2/2/ aa ZZZP

Donde Z/2 es el valor de la normal estándar tal que el área a la derecha de dicho valor es /2.

Intervalo de confianza para la Media Poblacional (varianza conocida).

Luegose distribuye como una normal estándar.

Page 21: Intervalos de confianza-1

Intervalo de confianza para la Media Poblacional (varianza conocida).

Sustituyendo la fórmula de Z, se obtiene:

P( - Z/2 / < < + Z/2 / ) = 1 -

Los dos extremos del intervalo son aleatorios.

De lo anterior se puede concluir que un Intervalo de Confianza del 100 (1-) % para la media poblacional , es de la forma:

( – Z/2 / , + Z/2 / )

nX

x xn n

nX

Page 22: Intervalos de confianza-1

Inferencias acerca de la Media Poblacional (varianza conocida).

La siguiente tabla muestra los Z/2 más usados.

Nivel deConfianza

Z/2

90 1.645

95 1.96

99 2.58

Page 23: Intervalos de confianza-1

Los parámetros poblacionales son fijos, no aleatorios.

Los estadísticos o los estimadores son variables aleatorias (su valor depende de la muestra seleccionada: los estadísticos calculados para distintas muestras darán, en general, resultados distintos).

Page 24: Intervalos de confianza-1

En la práctica si la media poblacional es desconocida entonces, es bien probable que la varianza también lo sea puesto que en el cálculo de 2 interviene . Si ésta es la situación, y si el tamaño de muestra es grande (n > 30), entonces 2 es estimada por la varianza muestral s2 y se puede usar la siguiente fórmula para el intervalo de confianza de la media poblacional:

)/,/ 2/2/( nszxnszx

Intervalo de confianza para la Media Poblacional (varianza desconocida).

Page 25: Intervalos de confianza-1

Intervalo de confianza para la Media Poblacional (varianza desconocida).

Supongamos que la población es normal con media y varianza desconocida y que se desea hacer inferencias acerca de , basada en una muestra pequeña (n < 30) tomada de la población. En este caso la distribución de la media muestral ya no es normal, sino que sigue la distribución t de Student.

X

Page 26: Intervalos de confianza-1

)/,/( 2/2/ nstxnstx

Si de una población Normal con media y desviación estándar desconocida se extrae una muestra de tamaño n, entonces el estadístico:

n

SX

t se distribuye como una t de

Student con n-1 grados de libertad.

Un intervalo de confianza del 100 (1-) % para es de la forma:

donde s es la desviación estándar muestral.t(n-1,/2) es un valor de t con n–1 grados de

libertad y tal que el área a la derecha de dicho valor es /2.