INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc...

49
INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005

Transcript of INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc...

Page 1: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y

TAMAÑO DE MUESTRA

Mario Briones L.MV, MSc

2005

Page 2: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Estimador puntual El descriptor de tendencia central

que es la media aritmética o promedio, ocupa una posición puntual sobre la recta numérica

x

Page 3: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

El promedio como variable aleatoria Si una muestra bien tomada sobre

una población dada ha generado un promedio

Una segunda muestra generará “probablemente” un promedio nuevo, diferente del anterior

PREGUNTA: alguno de los promedios es incorrecto?

x

Page 4: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

El promedio como variable aleatoria Esto significa que cada vez que se

toma una muestra de tamaño n, el promedio obtenido puede considerarse como una observación perteneciente a una población con una distribución

Esta distribución tiene media y varianza 2/n

Page 5: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

El error estándar de la media La dispersión de la media muestreal para

un tamaño n, fluctua alrededor de con una desviación estándar igual a s/n

Si la muestra es grande, la distribución de la media muestreal será aproximadamente normal, sin importar si la población de origen de los datos no tiene distribución normal.

Page 6: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Las probabilidades de la curva normal aplicadas a la distribución del promedio

Si la distribución de los promedios sigue una curva normal, entonces hay una probabilidad total de ocurrencia de estos promedios, bajo la curva normal

Page 7: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Las probabilidades de la curva normal aplicadas a la distribución del promedio

x +1 +2 +3-3 -2 -1Unidades de desviación

Unidades de error estándar

100% de probabi-lidades de todos los promediosobtenidos con muestrasde tamaño n

Page 8: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

x +1 +2 +3-3 -2 -1Unidades de desviación

Unidades de error estándar

100% de probabi-lidades de todos los promediosobtenidos con muestrasde tamaño n

Si la distribución de los promedios sigue una curvanormal, entonces hay una probabilidad total deocurrencia de estos promedios, bajo la curva normal

Page 9: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

En resumen: El promedio de todos los posibles

promedios de infinidad de muestras de tamaño n, cae exactamente sobre la media poblacional .

Esto se debe a que la probabilidad de cada promedio de caer por encima o

por debajo de es exactamente la misma, aunque la distribución de la variable original no sea normal y siempre que el tamaño de la muestra sea grande.

Page 10: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Por lo tanto: Utilizando las propiedades de la

distribución normal, se puede dar una magnitud a la probabilidad de ocurrencia de a partir del promedio calculado.

Primero que nada, esto significa que entre menos una y más una unidad de error estándar (cualquiera sea su magnitud) se encuentra APROXIMADAMENTE, el 68% de esas probabilidades.

Page 11: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 10 tomadas sobre un total de 530 pesos (con promedio 38.9)

33.0

35.0

37.0

39.0

41.0

43.0

45.0

47.0

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43

Muestra

Peso

al n

acim

ient

o (K

g)

Page 12: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 10

02468

1012141618

34.8 36.2 37.6 39 40.4 41.8 ymayor...

Clase

Fre

cue

nci

a

Page 13: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 40 tomadas sobre un total de 530 pesos (con promedio 38.9)

36.0

37.0

38.0

39.0

40.0

41.0

42.0

43.0

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43

Muestras

Peso

al n

acim

ient

o (k

gs)

Page 14: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 40

0

2

4

6

8

10

12

14

37.6 38.1 38.7 39.3 39.8 40.4 ymayor...

Clase

Fre

cue

nci

a

Page 15: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

x +1 +2 +3-3 -2 -1

68%

Page 16: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Probabilidades de 95 y 99% Si queremos cubrir, a partir de

nuestro estimador de la media, un 95% de las probabilidades de incluir, con el mismo tamaño de muestra, la media real de la población, tenemos que dividir en dos un área igual a 0.95. Esto da 0.475.

Page 17: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

x

?

?

?

?

?

?

La probabilidad de la media poblacional es simétrica alrededor de la media de la muestra

Page 18: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Límites de la curva normal para dejar sólo un 5% de probabilidad de error de no cubrir con el intervalo de confianza a la media poblacional

95%

z: -0.475 z: + 0.475

5%

2.5% 2.5%

Page 19: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Probabilidades de 95 y 99% El valor de z que deja hacia entre

cero y z un 0.475 de las probabilidades es 1.96. Esto significa que ± 1.96 unidades de error estándar a partir del promedio, se ubica ese 95% de probabilidades.

El valor respectivo para 99% de confianza es de 2.58.

Page 20: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Promedios e intervalos de confiaza de 95% para la media de la población, con muestras de tamaño 40

35.036.0

37.038.039.0

40.041.042.0

43.044.0

1 5 9 13

17

21

25

29

33

37

41

muestras

Peso d

e n

acim

iento

(kg

s)

Page 21: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Estimación de intervalo: el error estándar de la media Para conocer cuanta es la distancia hacia

arriba o hacia debajo de la media, expresada en las unidades de medición de la variable, sólo es necesario multiplicar el error estándar (que está expresado en unidades de la variable) por el valor de z que define la probabilidad (ZP). La siguiente expresión se aplica CUANDO DE CONOCE LA VARIANZA DE LA POBLACION:

x zP x /n

Page 22: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

EJEMPLO: Los datos siguientes corresponden a los nivelesde Hormona Luteinizante (LH) en nanogramos por ml desuero de 5 ovejas administradas con Naloxona a las 20

semanas de edad, durante la noche y el día

diurno0.720.511.010.490.37

promedio 0.62desv. est. 0.25error est. 0.11

nocturno0.680.480.720.400.41

promedio 0.538desv. est. 0.15error est. 0.07

Page 23: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

0.62 conc. LH (ng/ml)

1.96(/n)1.96(/n)

Intervalo de confianza para la concentración diurna de LH.

Page 24: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

1.96 x 0.11 1.96 x 0.11

0.62 conc. LH (ng/ml)

Intervalo de confianza para la concentración diurna de LH.

Page 25: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

0.22 0.22

Intervalo de confianza de 95% para la media de la Concentración de LH en la población de referencia,

asumiendo que se conoce la varianza de la población:

0.62 0.22

0.40 0.62 0.84 conc. LH (ng/ml)

Page 26: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

QUE PASA CUANDO NO SE CONOCELA VARIANZA DE LA POBLACION?

Page 27: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Asumir que la desviación estándar de la población seconoce, significa que, aunque no se conozca la mediapoblacional, se conoce la forma de la campana quees característica de esa variable y por lo tanto se

puede utilizar para estimar la ubicación probable de

Page 28: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Asumir que la desviación estándar de la población no seconoce, implica no tener claridad acerca de la formareal de la campana de la variable, lo cual va a redundaren una menor exactitud al momento de determinar

un rango para la probable ubicación de

Page 29: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

El significado práctico de la desviación “típica” En la práctica, cuando la muestra es

pequeña, la certeza sobre la “veracidad” de s2 como estimador de es mucho menor que cuando s2 se ha calculado en una muestra de gran tamaño; en el primer caso, lo más conveniente es ASUMIR que no es sino s2 (un estimador)

Page 30: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

El desconocimiento de la varianza y por endede la desviación estándar, agrega incertidumbre

a la estimación del intervalo de confianza que debería traducirse en un intervalo de mayor

tamaño para la potencial ubicación de la media poblacional.

Page 31: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Esto significa que la distribución normal no permite conocer las probabilidades igual que antes, se necesita corregir la

curva normal.

Page 32: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Distribuciónnormal

Distribución tpara 200, 50y 10 gradosde libertad

Distribución de t de student

Page 33: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Relación entre la estadística y la cerveza...¿!?

Page 34: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

William Sealy Gosset fue el hijo mayor del coronel Frederic Gosset, R.E. Nació en Canterbury en el año de 1876 y falleció el 16 de octubre de 1937.Se educó en Winchester, en donde más tarde fue profesor, y en el New College de Oxford en donde estudió química y matemáticas.En 1899 se inició en trabajos en el departamento de fermentación de la compañía cervecera de los Sres. Guinness en Dublin. No se sabe con exactitud en qué momento empezó a interesarse Gosset en la estadística, sin embargo en ese época se empezaron a usar métodos científicos y determinaciones de laboratorio para técnicas de fermentación, por lo que es muy posible que siendo Gosset el de mayorinclinación matemática del departamento de fermentación recibiera las preguntas que le hacían sus colegas sobre los métodos estadísticos en uso y sobre la masa de datos que se colectaban

Page 35: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Su principal herramienta y con la que inició sus estudios fueron los libros "Teoría de errores de observaciones" de G.B.Airy y "El método de mínimos cuadrados" de M. Merriman. Se sabe que ya en 1903 él calculaba el error probable. Las circunstancias en las que se llevan a cabo los procesos de fermentación en la producción de cerveza, con materiales variables, susceptibilidad a cambio de temperaturas y necesariamente series pequeñas de experimentos, son tales que pronto demostraron a Gosset las limitaciones de la teoría demuestras grandes y le enfatizaron la necesidad de un método correcto para el tratamiento de muestras pequeñas. No fue entonces un accidente, sino más bien las circunstancias de su trabajo, las que dirigieron a Gosset hacia este problema, y lo condujeron al descubrimiento de la distribución de la desviación estándar muestral, lo cual dio origen a lo que en su forma moderna se conoce como la prueba t.

Page 36: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Debido a que losadministradores de la empresa Guiness no autorizaron al Mr. Gosset a publicar los trabajos, él utilizó el seudónimo Student.

Page 37: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Distribución de t de Student Si se observa la tabla de t, se puede

notar que cuando el tamaño de la muestra es infinito, la probabilidad es igual que en la tabla de distribución normal, por ejemplo, 1.96 para la probabilidad de 95%.

Page 38: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Distribución de t de student

Page 39: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

INTERVALO DE CONFIANZA PARALA MEDIA CUANDO NO SE CONOCE

LA VARIANZA.

La única diferencia, cuando la varianza de la Población no se conoce, es que el valor de

probabilidad que debe emplearse para determinar el intervalo de confianza de la media,

es el valor de t para los grados de libertad correspondientes.

Es fácil observar que asumir conocimiento de lavarianza tiene mucho mayor efecto cuando el

tamaño de la muestra es pequeño.

Page 40: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Distribución de t de student (dos colas)

grados delibertad 0.500 0.400 0.200 0.100 0.050 0.025 0.010 0.005 0.001

1 1.0000 1.3764 3.0777 6.3137 12.7062 25.4519 63.65592 0.8165 1.0607 1.8856 2.9200 4.3027 6.2054 9.9250 14.0892 31.59983 0.7649 0.9785 1.6377 2.3534 3.1824 4.1765 5.8408 7.4532 12.92444 0.7407 0.9410 1.5332 2.1318 2.7765 3.4954 4.6041 5.5975 8.61015 0.7267 0.9195 1.4759 2.0150 2.5706 3.1634 4.0321 4.7733 6.8685

6 0.7176 0.9057 1.4398 1.9432 2.4469 2.9687 3.7074 4.3168 5.95877 0.7111 0.8960 1.4149 1.8946 2.3646 2.8412 3.4995 4.0294 5.40818 0.7064 0.8889 1.3968 1.8595 2.3060 2.7515 3.3554 3.8325 5.04149 0.7027 0.8834 1.3830 1.8331 2.2622 2.6850 3.2498 3.6896 4.7809

10 0.6998 0.8791 1.3722 1.8125 2.2281 2.6338 3.1693 3.5814 4.5868

11 0.6974 0.8755 1.3634 1.7959 2.2010 2.5931 3.1058 3.4966 4.436912 0.6955 0.8726 1.3562 1.7823 2.1788 2.5600 3.0545 3.4284 4.317813 0.6938 0.8702 1.3502 1.7709 2.1604 2.5326 3.0123 3.3725 4.220914 0.6924 0.8681 1.3450 1.7613 2.1448 2.5096 2.9768 3.3257 4.140315 0.6912 0.8662 1.3406 1.7531 2.1315 2.4899 2.9467 3.2860 4.0728

Probabilidad de un valor mayor, ignorando el signo

-t 0 +t

Page 41: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

EJEMPLO: Los datos siguientes corresponden a los nivelesde Hormona Luteinizante (LH) en nanogramos por ml desuero de 5 ovejas administradas con Naloxona a las 20

semanas de edad, durante la noche y el día

diurno0.720.511.010.490.37

promedio 0.62desv. est. 0.25error est. 0.11

nocturno0.680.480.720.400.41

promedio 0.538desv. est. 0.15error est. 0.07

Page 42: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

0.62 conc. LH (ng/ml)

2.78(s/n)2.78(s/n)

Intervalo de confianza para la concentración diurna de LH.

Page 43: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

2.78 x 0.11 2.78 x 0.11

0.62 conc. LH (ng/ml)

Intervalo de confianza para la concentración diurna de LH.

Page 44: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

0.31 0.31

Intervalo de confianza de 95% para la media de la concentración de LH en la población de referencia,

asumiendo que no se conoce la varianza de la población:

0.62 0.31

0.31 0.62 0.93 conc. LH (ng/ml)

Page 45: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

INTERVALO DE CONFIANZA PARA LA MEDIACUANDO SE CONOCE LA VARIANZA

DE LA POBLACION

INTERVALO DE CONFIANZA PARA LA MEDIACUANDO NO SE CONOCE LA VARIANZA

DE LA POBLACION

x zP x /n

x tP-Gl x s/n

Page 46: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

DETERMINACION DEL TAMAÑO DELA MUESTRA NECESARIO PARA

DESCRIBIR APROPIADAMENTE UNAPOBLACION

La paradoja del muestreo se resuelve sobre la base del conocimiento previo de la varianza de

la población y el error admisible que sedesea para el estimador.

Page 47: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Si el intervalo de confianza para la media se define como

x zP x /nAl querer determinar a priori un tamaño de

muestra para un error predeterminado,

se puede asumir que zP y se conocen y n es la incógnita.

Page 48: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Resolviendo para n:

probabilidad de 95%, y asumiendo 1.96= 2 paramayor simplicidad

n= 4s2/L2

donde L= error admisible en unidades de medición

para probabilidad de 99%

n= 6.6s2/L2

Page 49: INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Ejemplo: asumiendo que la desviación estándar de la población de los valores de LH diurna después de la inyección de naloxonaes igual a 0.25, los tamaños apropiados de muestra paradiferentes magnitudes de error (con 95% de confianza)son los siguientes:

Error n

± 0.01 4 x (0.25)2/(0.01)2= 2500

± 0.05 4 x (0.25)2/(0.05)2= 100

± 0.10 4 x (0.25)2/(0.10)2= 25

± 0.15 4 x (0.25)2/(0.15)2= 11