Estimación de intervalos de confianza para proporciones, diferencia de medias, y diferencia de...

download Estimación de intervalos de confianza para proporciones, diferencia de medias, y diferencia de proporciones; Magnitud de la muestra

of 13

description

Boestadítica

Transcript of Estimación de intervalos de confianza para proporciones, diferencia de medias, y diferencia de...

Estimacin de intervalos de proporciones, diferencia de medias y de proporciones

2.2.2. Estimacin de intervalos de confianza para proporciones, diferencia de medias, y diferencia de proporciones;Magnitud de la muestraN. GilbertYa hemos visto cmo encontrar una estimacin de intervalo para la media de la poblacin despus de estudiar la distribucin muestral de las medias.Ahora veremos cmo hacer tres clases adicionales de estimacin de intervalo, pero todas ellas irn precedidas del estudio de una distribucin muestral. Hay algunas nuevas notaciones, a saber: P para la proporcin de una poblacin, p para la proporcin de una muestra, para el error estndar de las proporciones (es igual a la desviacin estndar de la distribucin muestral de las proporciones), y as sucesivamente.Sin embargo, una vez qu se haya acostumbrado a la notacin, bsquense las semejanzas entre todas las distribuciones muestrales que se estudian. Considerando que las distribuciones muestrales que se emplearn en este capitulo son invariablemente distribuciones normales, en todos los casos se emplearn puntuaciones estndar para encontrar reas debajo de la curva normal. Distribucin muestral de:Puntuaciones en la distribucin muestralMediaError estndarPuntuaciones estndar

Medias

ProporcionespP

Diferencia de las medias

Diferencia de las proporciones

DISTRIBUCION MUESTRAL DE PROPORCIONESLo primero es encontrar estimaciones de punto y de intervalo de una proporcin de poblacin a partir de una proporcin de muestra.

Ejemplo: Se efecta una encuesta para determinar cuantos candidatos votarn por Obama. Se toma una muestra aleatoria de 1000 electores y se advierte que 520 planean votar por l. Calclese el porcentaje de la poblacin que votar por Obama, con nivel de confianza de 95 por 100.Debe ser patente por intuicin que una estimacin de punto es 520/1000 = 52 %Es lo mejor que puede obtenerse acerca de la proporcin de la poblacin, pero tambin en este caso esto resulta intil a menos que se tenga la certeza de qu tan buena es la conjetura. Antes de encontrar una estimacin de intervalo debemos ver primero que es la distribucin muestral de proporciones.Una vez ms, tomamos todas las posibles muestras (con reposicin o sin ella) de tamao o magnitud n y encontramos la proporcin en cada muestra, de modo que se forme una distribucin de proporciones de muestra, conocida, comn pero como distribucin muestral de las proporciones. Notacin: P = proporcin de la poblacin

Q = 1 P

p = proporcin o porcentaje de una muestra (no una probabilidad, sino una proporcin)p = media de la distribucin muestral de las proporciones = desviacin estndar de la distribucin muestral de las proporcionesp = error estndar de las proporciones

N = tamao de la poblacinn = tamao de la muestra

En la distribucin muestral de las proporciones se debe considerar que:1.

2. si la poblacin es finita, la muestra se toma sin reposicin y N 20 y en los dems casos3. La distribucin es aproximadamente normal si nP y nQ tienen magnitud de 15 o ms. En este caso, se debe tener precaucin, pues p siempre est entre 0 y 1Si P , la distribucin muestral es aproximadamente normal para n 30.

P

Pero si p est cerca de 0 ( de 1), la distribucin muestral tender a tener un extremo o cola mas larga a la derecha ( a la izquierda) y deber aumentarse el n para obtener una aproximacin a la curva normal.

0 P 0 1

0 P 1 1Ejemplo 1En la ciudad de Alabama hay tres electores registrados, A, B Y C. A votar por M para gobernador, y B Y C no votarn por M. Considrese la distribucin muestral de proporciones de muestras de magnitud 2 tomadas con reposicin o reemplazo. Sea P la proporcin de quienes votarn por M.

P = 1/3, Q = 2/3, N = 3, n = 2, p = Muestrap

A, A1

A, B1/2

A, C1/2

B, A1/2

B, BO

B, CO

C, A1/2

C,BO

C, CO

Distribucin muestral de proporciones

pffpfp2

1111

421

0400

932

(a) p = 3/9 = 1/3P (= 1/3).

(b)

(c) La distribucin muestral de proporciones no es normal en este caso; nP, igual a 2/3, es demasiado pequea. Ahora consideraremos un ejemplo sin reposicin.

Ejemplo 2

Una poblacin consiste en seis personas: D, E, F, G, H, I, de quienes dos (D, E) usan gafas y cuatro (F, G, H, I) no usan gafas.

P = proporcin de la poblacin que usa gafas = 2/6 = 1/3.

Q = proporcin de la poblacin que no usa gafas = 1 - P = 1 - 1/3 = 2/3.

Considrense todas las muestras de tamao 3 tomadas sin reposicin de esta poblacin. Hay 6C3 = 20 de ellas. Para cada muestra, p = proporcin de quienes usan anteojosmuestrapffpp p(p p)2f(p p)2

FGH

FGI

FHI

GHI

040-1/3 1/94/9

DFG

DFH

DFI

DGH

DGI

DHI

EFG

EFH

EFI

EGH

EGI

EHI

1/3124000

DEF

DEG

DEH

DEI

2/348/31/31/94/9

2020/38/9

De la distribucin de proporciones:

3. Histograma de la distribucin muestral de proporciones:

(n es demasiado pequea para que la distribucin sea normal)

12 8 4 0 1/3 2/3

ESTIMACION DEL INTERVALO DE PROPORCIONES

Con la ayuda de un bosquejo de una curva normal, el lector debe ser capaz de resolver problemas como este:

Ejemplo 1

Si P = 0.4 y N = 1000, entre qu dos valores hay probabilidad de 95 %, de que una muestra de tamao 30 tenga proporcin p?

P = 0.4, Q = .6, N = 1,000, n = 40.

0.4 -1.96 0 1.96Hay probabilidad de 0.95 de modo que A(z) = .475 Y z = 1.96.Como siempre, la transformacin de cualquier puntuacin en puntuacin estndar o z se hace al restar la media de la distribucin p = P y dividir por la desviacin estndar (p).

p = 0.4 1.96 (0.077) = 0.25 0.55

Hay probabilidad de 0.95 de modo de que la proporcin est entre 0.25 y 0.55 Ejercicio 1Efecte una encuesta para descubrir cuntos electores votarn por el candidato A para presidente. Se toma una muestra aleatoria de 1000 electores y se descubre que 520 planean votar por el candidato A. Halle un intervalo de confianza de 95 % para la proporcin de quienes votarn por el candidato A.Comencemos con un razonamiento semejante al empleado para los intervalos de confianza de las medias; a saber 95 por 100 de las puntuaciones de cualquier distribucin normal estn dentro de 1.96 unidades de desviacin estndar de la media de la distribucin.

P

-1.96 0 1.96Entonces...

Resp: p = 0.52 1.96 pEjercicio 2

Mil personas acuden a ver un juego. Se advierte que 42 de las primeras 90 personas que llegan son mujeres.

a) Halle un intervalo de confianza de 95 por 100 para el porcentaje de mujeres en el pblico (cuidado, encuentre la trampa antes de continuar leyendo)b) Resuelva el ejercicio, pero con una muestra aleatoria de 90 personas de las cuales 42 son mujeres. A nivel de confianza de 95 % Resp: 0.369, 0.565DISTRIBUCION MUESTRAL DE DIFERENCIAS DE MEDIASConsideremos ahora dos poblaciones (una formada por el peso de todos los varones mayores de 17 aos en Estados Unidos, y la segunda por el peso de todas las mujeres mayores de 17 aos de edad en Yucatn, por ejemplo). La primera poblacin (X) tiene media x y desviacin estndar x; la segunda (Y) tiene media y y desviacin estndar y .

De la primera poblacin .se toma una muestra de magnitud nx y se calcula la media ; De la segunda poblacin se toma independientemente una muestra de magnitud ny y se calcula ; despus, se precisa - .Hgase lo anterior para todos los posibles pares de muestras que pueden tomarse independientemente de las dos poblaciones. Las diferencias, - , son una nueva serie de puntuaciones que forman la distribucin muestral de diferencias de medias.

Ejemplo: Poblacin X: 1, 3, 5 Poblacin Y: 10, 20, 30, 40

a) Se toman muestras de tamao 2 de la primera poblacin y de tamao 1 de la segunda y se forma la distribucin muestral de la diferencia de medias.

b) Se calculan x x2; , y, y2 , .( ntese que se piden las varianzas no las desviaciones)La media de la distribucin muestral de las diferencias de medias es:

y el error estndar de la distribucin muestral de las diferencias de medias es

a) MuestraDe la poblac. XDe la poblac. Y

-

1, 310210- 8

1, 320220-18

1, 330230-28

1, 340240-38

1, 510310- 7

1, 520320-17

1, 530330-27

1, 540340-37

3, 510410- 6

3, 520420-16

3, 530430-26

3, 540440-36

nx = 2, ny = 1b) x = 3, x2 = 8/3, nx = 2, = 2/3. (El muestreo se hace sin reposicin, de modo que se necesita el factor de correccin advirtase que el factor de correccin est elevado al cuadrado, pues se busca la varianza y no la desviacin estndar)y = 25, y2 = 125, ny = 1, = 125.x - y = 3 - 25= -22

nx y ny son demasiado pequeas para esperar una distribucin normal. Por lo tanto, las caractersticas de una distribucin muestral de diferencia de medias son:1. La media de una distribucin muestral de diferencia de medias es igual a la diferencia de las medias de las poblaciones

2. La desviacin estndar de la distribucin muestral de diferencia de medias, tambin llamada error estndar de diferencia de medias es:

donde es el error estndar de la poblacin X

y es el error estndar de la poblacin Y

3. La distribucin est mas cerca de la normal cuando nx 30 y ny 30 si ambas poblaciones son normales.USO DE LA DISTRIBUCION MUESTRAL DE DIFERENCIAS DE MEDIASAl utilizar esta distribucin muestral, debe destacarse netamente que las dos muestras deben formarse aleatoriamente. Cuando se investiga el tiempo de reaccin de una muestra aleatoria de 36 estudiantes antes de beber 30 mL de alcohol y despus de beberlos, hay dos grupos o series de puntuaciones, pero no dos muestras independientes. Las tcnicas para obtener deducciones de dos series de puntuaciones relacionadas o pareadas son otros estudios.

Otra limitacin acerca del uso de esta distribucin muestral de medias es que nx y ny deben valer por lo menos 30 si se utilizan sx2 sy2 para encontrar y y cuando no se cumple el requisito, entonces se deber utilizar otros mtodos.Ejercicio 3

El IQ medio de 1200 estudiantes de un colegio A es de 122, con desviacin estndar de 6; 2000 estudiantes de otro colegio B tienen IQ medio de 118, con desviacin estndar de 5. Cul es la probabilidad de que el IQ medio de una muestra aleatoria de 36 estudiantes del Colegio A sea por lo menos 6 puntos ms alto que el IQ medio de una muestra aleatoria de 49 estudiantes del colegio B? Trate de resolver este problema antes de continuar leyendo. Resp: 0.052Ejercicio 4.

Un psiclogo estudia en el laberinto 36 ratas cuya dieta no posee vitamina A, y advierte que el tiempo medio para recorrer el laberinto es de 4 minutos, con desviacin estndar de 0.50 de minuto; despus estudia en el mismo laberinto 50 ratas cuya dieta es rica en vitamina A, y advierte tiempo medio de 3.2 minutos con desviacin estndar de 0.40 de minuto. A nivel de confianza de 95 por 100, Cual es el intervalo para la diferencia en el tiempo medio para recorrer el laberinto de ratas con dieta sin vitamina A y rica en vitamina A? Resp: 0.6 a 1 minutoEjercicio 5

Una muestra aleatoria de 50 no fumadores tiene promedio de vida de 76 aos, con desviacin estndar de 8 aos; una muestra aleatoria de 65 fumadores tiene vida de 68 aos con desviacin estndar de 9 aos; encuntrese el intervalo de confianza de 95 por 100 para la diferencia de la vida media para los no fumadores y fumadores. Resp: 4.8 a 11.2

DISTRIBUCION MUESTRAL DE DIFERENCIAS DE PROPORCIONESConsideremos de nuevo dos poblaciones distintas (electores nacidos en Nueva York y electores en Chicago, por ejemplo). La primera poblacin tiene una proporcin Px que se ajusta a determinada categora (electores en la ciudad de Nueva York que votarn por el candidato A para presidente) y tiene proporcin Qx = 1 - Px que no se adaptan a esta categora (no votarn por el candidato A para presidente), Las mismas proporciones en la segunda poblacin son Py y Qy.Se toma una muestra de magnitud nx de la poblacin X (todos los votantes de la ciudad de Nueva York) y se encuentra la proporcin px que se adaptar a determinado grupo (votarn por el candidato A para presidente). Despus se toma independientemente una muestra de magnitud ny de la poblacin Y (todos los electores en Chicago) y se encuentra la proporcin Py de quienes se adaptan a la categora dada. Se encuentra la diferencia Px- Py, Y se tendr una puntuacin en la distribucin muestral de diferencias de proporciones. Para encontrar todas las puntuaciones o calificaciones, se repasa el mismo proceso con todas las posibles combinaciones de muestras de magnitud nx y ny, respectivamente, tomadas en forma independiente de las dos poblaciones.Nada de lo anterior debe sorprender al lector, como tampoco lo harn los siguientes resultados:1. La media de la distribucin muestral de proporciones,, es Igual a la diferencia de las proporciones Px y Py en las poblaciones X e Y.

2. , la desviacin estndar de esta nueva distribucin (tambin llamada error estndar de diferencias de proporciones) es igual a

donde es el error estndar de la poblacin X

y es el error estndar de la poblacin Y

Sin dejar de considerar que :. si la poblacin es finita, la muestra se toma sin reposicin y N 20

y en los dems casos

Ntese que:

de modo que no se moleste en encontrar races cuadradas, pues est a punto de elevar al cuadrado. En consecuencia,

Advirtase el signo + debajo de la raz cuadrada, aunque se trata de una distribucin de diferencias.

3. Esta nueva distribucin es aproximadamente normal si nx Y ny son 30Ejemplo

Hay tres electores en la ciudad de Peacock, A, B y C. A votar por M para gobernador; B y C no votarn por M. La ciudad de Boots (una metrpoli) tambin tiene tres electores, D, E Y F. D Y E votarn por M, y F votar contra l. Encuntrese la distribucin muestral de diferencias de proporciones si cada muestra consiste de 2 votantes de Peacock y 2 votantes de BootsRespuesta:

Muestra Proporcin para MDe PeacockDe BootsDe Peacock (p1)De Boots (p2)p1 p2

ABDE1-

ABDF0

ABEF0

ACDE1-

ACDF0

ACEF0

BCDE01-1

BCDF0-

BCEF0-

La distribucin muestral de diferencias de proporciones est dentro de la casilla arriba a la derecha. Resumiendo en la tabla siguiente:p1 p2 ff (p1 p2)f (p1 p2)2

-11-11

- 4-21

0400

9-32

1. = 1/3 - 2/3 = -1/32.

3. Como antes, nx y ny son demasiado pequeas para que la distribucin muestral tenga distribucin normal.Ejercicio 6

Dos grupos consisten de 1OO tuberculosos. Se administra un nuevo frmaco al primer grupo y no al segundo (grupo testigo). Se advierte que en el primer grupo se restablecen 75 pacientes, y slo 60 en el segundo. Encuentre los lmites de confianza de 95 por 100 para la diferencia en la proporcin de todos los pacientes de tuberculosis que se restablecen. Resp: 0.02 a 0.28Observe que los siguientes enunciados son equivalentes?1. Hay probabilidad de O.95 de que la diferencia en las proporciones de pacientes tratados con el nuevo frmaco que se restablecen y los que no reciben el medicamento est entre .02 y .28.

2. Hay probabilidad de .95 de que entre 2 y 28 por 100 ms de pacientes se restablezcan cuando se tratan con el nuevo frmaco.3. El intervalo de confianza de 95 por 100 para la diferencia en las proporciones de pacientes tratados con el nuevo frmaco que se restablecen y los que no lo reciben es de 2 a 28 por 100.

RESUMEN DE ECUACIONES PARA DEDUCCIN ESTADSTICADeduccin

acerca de:EcuacinError estndar

MediasSi se conoce

Si no se conoce

Se ha omitido el

factor:

pero el alumno debe

saber cuando se aplica.

ProporcionesSi se conoce P

Si no se conoce P

Diferencia de medias

Diferencia de proporciones

MAGNITUD O TAMAO DE UNA MUESTRAEn los problemas que se han planteado hasta este momento, se ha enunciado la magnitud o tamao de la muestra. Sin embargo, en la vida real un investigador se percata de que, en general una muestra ms grande puede aumentar la exactitud, si se somete a prueba toda la poblacin y no se necesita deduccin estadstica, pero poner a prueba una muestra mayor exige ms tiempo y dinero.Una pregunta prctica e indispensable para el estadstico es qu tan grande es una muestra para determinado grado de exactitud.Cuntas personas deben someterse a encuesta para que un politlogo estime la proporcin de quienes votarn por el candidato X dentro de confianza de 1 y 98 por 1OO? Cuntas ratas debe estudiar un psiclogo si necesita saber el tiempo medio de reaccin dentro de 0.6 de segundo a nivel de confianza de 95 por 100?

"Con confianza de 98 por 100" o "con confianza de 95 por 100" significa que, para cada 100 muestras que pudieran tomarse, los intervalos de confianza calculados en 2 o en 5 casos no incluirn el parmetro de la poblacin; en estos casos, no se alcanzar la exactitud planeada.

La nica manera de garantizar la exactitud enunciada es medir toda la poblacin.pero...Al estimar la magnitud de la muestra para calcular media, proporcin, diferencias de medias y diferencias de proporciones de la poblacin se deber:1. Precisar la exactitud deseada, o dicho de otra manera, decidir qu error E en los resultados es permisible. Es necesario conocer la media de la poblacin dentro de una o tres unidades de puntuacin, o dentro de 0.1 0.05 unidades de desviacin estndar?2. Establecer una ecuacin en que participen la magnitud de la muestra n y el error permisible E. Esta ecuacin incluira los parmetros de la poblacin que deben estimarse.

3. Despejar la ecuacin para n.

Una frmula comnmente utilizada es donde E es el error mximo estimadoEjemplo: Un fabricante de vacunas sabe que la desviacin estndar de la duracin de las vacunas es de 100 das. De que tamao debe ser la muestra para que brinde una confianza del 95 % de que el error en la duracin media calculada de las vacunas sea mximo de 10 das?

Resp: = 384.2 385 muestras, para estar seguro de que se hizo correctamente la prueba, aun que los resultados de la prueba no sean positivos._1284284962.unknown

_1284365391.unknown

_1284437550.unknown

_1284444403.unknown

_1284446298.unknown

_1284521679.unknown

_1284528753.unknown

_1284529095.unknown

_1284446311.unknown

_1284446041.unknown

_1284446157.unknown

_1284444582.unknown

_1284446029.unknown

_1284437573.unknown

_1284439657.unknown

_1284444311.unknown

_1284438883.unknown

_1284367213.unknown

_1284436859.unknown

_1284437180.unknown

_1284437314.unknown

_1284367980.unknown

_1284367080.unknown

_1284366203.unknown

_1284366946.unknown

_1284360755.unknown

_1284363726.unknown

_1284364640.unknown

_1284365001.unknown

_1284364282.unknown

_1284363694.unknown

_1284363711.unknown

_1284363670.unknown

_1284359377.unknown

_1284360397.unknown

_1284360604.unknown

_1284360276.unknown

_1284359320.unknown

_1284359334.unknown

_1284285072.unknown

_1284359217.unknown

_1284276032.unknown

_1284280768.unknown

_1284284540.unknown

_1284280751.unknown

_1284198836.unknown

_1284199382.unknown

_1284199850.unknown

_1284200230.unknown

_1284200294.unknown

_1284199885.unknown

_1284199480.unknown

_1284199270.unknown

_1284199348.unknown

_1284199174.unknown

_1284199228.unknown

_1284198862.unknown

_1284197988.unknown