Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

26
5.1 INTRODUCCION 5.2 DISTRIBUCIONES MUESTRALES 5.3 DISTRIBUCION DE LA MEDIA DE LA MUESTRA 5.4 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS MUESTRAS 5.1 INTRODUCCION 5.5 DISTRIBUCION DE LA PROPORCION DE LA MUESTRA 5.6 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS MUESTRAS 5.7 RESUMEN Antes de examinar el tema de estudio de este capftulo es conveniente repasar algunos de los conceptos importantes estudiados hasta ahora. En el capitulo 1 se presenta un vocabulario estadfstico util y basico, y tambien se estudian los conceptos fundamentales para la recolecci6n de datos. En el capitulo 2 se hace resaltar los procesos de organizaci6n y resumen de datos. Aquf es donde se introducen los conceptos de tendencia central y dispersi6n, y en donde se estudia c6mo ca1cular sus medidas descriptivas. En el capitulo 3 se presentan las ideas fundamentales de probabilidad y en el capitulo 4 se considera el concepto de distribuci6n de probabilidad. Estos conceptos son importantes para comprender la inferencia estadfstica, tema de estudio que abarca la mayor parte de este libro. Este capitulo sirve para vincular los conceptos ya mencionados, de naturaleza esencialmente descriptiva, con la mayorfa de los temas subsecuentes, seleccionados del area de estudio de la inferencia estadfstica. 124

Transcript of Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

Page 1: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

51 INTRODUCCION

52 DISTRIBUCIONES MUESTRALES

53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS MUESTRAS

51 INTRODUCCION

55 DISTRIBUCION DE LA PROPORCION DE LA MUESTRA

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS MUESTRAS

57 RESUMEN

Antes de examinar el tema de estudio de este capftulo es conveniente repasar algunos de los conceptos importantes estudiados hasta ahora En el capitulo 1 se presenta un vocabulario estadfstico util y basico y tambien se estudian los conceptos fundamentales para la recolecci6n de datos En el capitulo 2 se hace resaltar los procesos de organizaci6n y resumen de datos Aquf es donde se introducen los conceptos de tendencia central y dispersi6n y en donde se estudia c6mo ca1cular sus medidas descriptivas En el capitulo 3 se presentan las ideas fundamentales de probabilidad y en el capitulo 4 se considera el concepto de distribuci6n de probabilidad Estos conceptos son importantes para comprender la inferencia estadfstica tema de estudio que abarca la mayor parte de este libro

Este capitulo sirve para vincular los conceptos ya mencionados de naturaleza esencialmente descriptiva con la mayorfa de los temas subsecuentes seleccionados del area de estudio de la inferencia estadfstica

124

52 DISTRIBUCIONES MUESTRALES 125

52 DISTIUBUCIONES MUESmALES

El tema principal de este capitulo trata ace rca de las distribuciones muestrales Es necesario destacar la importancia de un entendimiento claro de estas distribushydones ya que este concepto es la clave para comprender la inferencia estadfsshytica Las distribuciones de probabilidad sirven para dos prop6sitos 1) permiten responder preguntas de probabilidad acerca de estadisticas muestrales y 2) proporcionan la teoria necesaria para hacervalidos los procedimientos de inshyferencia estadistica En este capitulo se utiliza la distribuci6n muestral para contestar preguntas de probabilidad acerca dela estadfstica muestral Se debe recordar que en el capitulo 2 se dijo que la estadistica muestral es una medida descriptiva como la media la mediana la variancia 0 la desviaci6n estandar que se calcula a partir de los datos de la muestra En los siguientes capftulos se estudia c6mo la distribud6n muestral hace validas las inferendas estadisticas Por ahora se inicia con la siguiente definicion

DEFINICION

La distribucion de todos los valores posibles que puede asumir una estadfstica calculados a partir de muestras del mismo tamano seleccionadas aleatoriamente de la misma poblacion se llamadistribuci6n muestrul de esa estadistica

Distribuciones muestrules elaboraci6n Las distribuciones muestrales pueden construirse empfricamente a partir de poblaciones finitas y discretas Para ello se procede como sigue

1 De una poblaci6n finita de tamano N se extraen de manera aleatoria todas las muestras posibles de tamano n

2 Se calcula Iii estadistica de interes para cada muestra

3 S~ ordenan en una columna los distintos valores observados de la estadistica y en otra col-qmna las frecuencias de ocurrencia correspondientes de cada vashylor observado

Elaborar la distribuci6n muestral es una tarea formidable si la poblaci6n es de un tamano muy grande e imposible si la poblaci6n es infinita En ultimo caso es posible obtener aproximaciones de las distribuciones muestrales toshymando un gran numero de muestras de un tamano dado

Distribuciones HllIestrales curacteristicas irnporlantes Normalmente para una distribuci6n muestral se tiene interes en conocer tres cosas media variancia y forma funcional (apariencia gnlfica)

Es bien conocida la dificultad que existe para elaborar una distribuci6n muestral de acuerdo con el procedimiento anterior cuando la poblaci6n es muy grande Tambien constituye un problema cuando la poblaci6n es infinita En este caso 10 mejor que se puede hacer de manera experimental es aproximar la distribuci6n muestral de la estadfstica

126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)

En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes

53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA

Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior

EJEMPLO 531

Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8

TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis

Segunda seleccion

6 8 12 14

Primera seleccion

6

8

10

12

14

66 (6) 86 (7) 106 (8) 126 (9) 146 (10)

68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)

6 lO (8)

8 10 (9) 1010 (10)

12 10 (11)

14 10 (12)

6 12 (9)

8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)

6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)

127

x

53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA

TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531

Frecuencia Frecuencia relativa

6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125

Total 25 2525

Se calcula otra medida de dispersion y se designa con la letra S como sigue

40 =lO

N-I 4

Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion

Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~

En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn

Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull

En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1

Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x

128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

fIx)

6

5

4

3

2

8 10 12 14 x6 Distribucion de la poblacion

fIX)

6

5

4

3

2

0

Distribucion muestral de X

FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x

DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica

Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As

LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10

x N 25 25

Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 2: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

52 DISTRIBUCIONES MUESTRALES 125

52 DISTIUBUCIONES MUESmALES

El tema principal de este capitulo trata ace rca de las distribuciones muestrales Es necesario destacar la importancia de un entendimiento claro de estas distribushydones ya que este concepto es la clave para comprender la inferencia estadfsshytica Las distribuciones de probabilidad sirven para dos prop6sitos 1) permiten responder preguntas de probabilidad acerca de estadisticas muestrales y 2) proporcionan la teoria necesaria para hacervalidos los procedimientos de inshyferencia estadistica En este capitulo se utiliza la distribuci6n muestral para contestar preguntas de probabilidad acerca dela estadfstica muestral Se debe recordar que en el capitulo 2 se dijo que la estadistica muestral es una medida descriptiva como la media la mediana la variancia 0 la desviaci6n estandar que se calcula a partir de los datos de la muestra En los siguientes capftulos se estudia c6mo la distribud6n muestral hace validas las inferendas estadisticas Por ahora se inicia con la siguiente definicion

DEFINICION

La distribucion de todos los valores posibles que puede asumir una estadfstica calculados a partir de muestras del mismo tamano seleccionadas aleatoriamente de la misma poblacion se llamadistribuci6n muestrul de esa estadistica

Distribuciones muestrules elaboraci6n Las distribuciones muestrales pueden construirse empfricamente a partir de poblaciones finitas y discretas Para ello se procede como sigue

1 De una poblaci6n finita de tamano N se extraen de manera aleatoria todas las muestras posibles de tamano n

2 Se calcula Iii estadistica de interes para cada muestra

3 S~ ordenan en una columna los distintos valores observados de la estadistica y en otra col-qmna las frecuencias de ocurrencia correspondientes de cada vashylor observado

Elaborar la distribuci6n muestral es una tarea formidable si la poblaci6n es de un tamano muy grande e imposible si la poblaci6n es infinita En ultimo caso es posible obtener aproximaciones de las distribuciones muestrales toshymando un gran numero de muestras de un tamano dado

Distribuciones HllIestrales curacteristicas irnporlantes Normalmente para una distribuci6n muestral se tiene interes en conocer tres cosas media variancia y forma funcional (apariencia gnlfica)

Es bien conocida la dificultad que existe para elaborar una distribuci6n muestral de acuerdo con el procedimiento anterior cuando la poblaci6n es muy grande Tambien constituye un problema cuando la poblaci6n es infinita En este caso 10 mejor que se puede hacer de manera experimental es aproximar la distribuci6n muestral de la estadfstica

126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)

En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes

53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA

Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior

EJEMPLO 531

Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8

TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis

Segunda seleccion

6 8 12 14

Primera seleccion

6

8

10

12

14

66 (6) 86 (7) 106 (8) 126 (9) 146 (10)

68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)

6 lO (8)

8 10 (9) 1010 (10)

12 10 (11)

14 10 (12)

6 12 (9)

8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)

6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)

127

x

53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA

TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531

Frecuencia Frecuencia relativa

6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125

Total 25 2525

Se calcula otra medida de dispersion y se designa con la letra S como sigue

40 =lO

N-I 4

Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion

Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~

En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn

Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull

En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1

Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x

128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

fIx)

6

5

4

3

2

8 10 12 14 x6 Distribucion de la poblacion

fIX)

6

5

4

3

2

0

Distribucion muestral de X

FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x

DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica

Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As

LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10

x N 25 25

Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 3: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)

En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes

53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA

Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior

EJEMPLO 531

Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8

TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis

Segunda seleccion

6 8 12 14

Primera seleccion

6

8

10

12

14

66 (6) 86 (7) 106 (8) 126 (9) 146 (10)

68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)

6 lO (8)

8 10 (9) 1010 (10)

12 10 (11)

14 10 (12)

6 12 (9)

8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)

6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)

127

x

53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA

TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531

Frecuencia Frecuencia relativa

6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125

Total 25 2525

Se calcula otra medida de dispersion y se designa con la letra S como sigue

40 =lO

N-I 4

Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion

Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~

En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn

Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull

En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1

Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x

128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

fIx)

6

5

4

3

2

8 10 12 14 x6 Distribucion de la poblacion

fIX)

6

5

4

3

2

0

Distribucion muestral de X

FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x

DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica

Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As

LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10

x N 25 25

Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 4: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

127

x

53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA

TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531

Frecuencia Frecuencia relativa

6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125

Total 25 2525

Se calcula otra medida de dispersion y se designa con la letra S como sigue

40 =lO

N-I 4

Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion

Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~

En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn

Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull

En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1

Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x

128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

fIx)

6

5

4

3

2

8 10 12 14 x6 Distribucion de la poblacion

fIX)

6

5

4

3

2

0

Distribucion muestral de X

FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x

DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica

Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As

LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10

x N 25 25

Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 5: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

fIx)

6

5

4

3

2

8 10 12 14 x6 Distribucion de la poblacion

fIX)

6

5

4

3

2

0

Distribucion muestral de X

FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x

DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica

Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As

LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10

x N 25 25

Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 6: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA

Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue

lt L(xj ilx)2cr=----shy

N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2

=-------------------------------- shy25

100 =-=4

25

Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es

cr 2 8 cr~= =-=4

x n 2

A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar

Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0

cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL

DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades

1 La distribucion de x sera normal

2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras

3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra

llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 7: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Teorema del limite central

Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande

Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande

La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande

Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra

Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que

N 51 5middot4middot31 = 10 muestras posibles

n(N n) 2131 213

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 8: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

La media de las lO medias muestrales es

Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n

La variancia de la distribuci6n muestral se calcula como sigue

30 - 3 10

y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es

n N 1

Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado

Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia

n N-l

Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal

Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N

1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 9: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES

Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones

1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il

b) Ox =degIf c) La distribucion muestral de x es normal

2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida

a) Ilx = Il

b) Ox =degI~donde n IN 05

- N-n Ox (o-vn)I- shy

V N I

c) La distribucion muestral de xes aproximadamente normal

AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos

EJEMPLO 532

Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190

Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion

Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a

1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse

En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 10: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA

en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar

x Jlx z=--- (531)

(5

La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral

(a)

x

a x= = 40161 110

1357

kJi=1856 190

(b)

109

1357

o z

(e)

FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 11: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

Esta area es igual al area de la derecha de

190-1856 z=----- 44 =110

40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357

La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull

EJEMPLO 533

Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml

Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es

P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212

= P(-236 ~ z ~ 236)

= 9909 - 0091

=9818 bull EJERCICIOS

531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar

532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea

a) Entre 170 y 195 b) Abajo de 175

c) Arriba de 190

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 12: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135

533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media

a) Mayor que 6 b) Entre 5 y 6

c) Menor que 52

534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media

a) Mayor a 6 dias b) Entre 4 y 6 dfas

c) Entre 45 y 55 dfas

535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16

a) P( X ~ 100) b) P(96 S x s lOS)

c)P(x S 110)

536 Dada fl= 50 (J 16 Yn = 64 calcular

a) P(45 S XS 55) b)P(xgt 53)

c)P(xlt 47) d) P(49 s x s 56)

537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n

538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia

539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra

a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105

54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS

Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 13: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo

JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL

EJEMPLO 541

Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20

Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras

Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull

Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente

Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy

rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 14: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS

TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras

Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias

nnil 12 xJl Xl2 Xll X l2

n n21 Z2 X21 X22 xl - X22

n31 n32 X31 XS2 XII XS2

Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541

Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue

(Xl X2 ) (Jll I-lz)z

(J2 (J2 _I +_2 (541) nJ nz

EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia

bull

u~ u~ -+ - =5333 n 1 n2

P- x x2 = P-1 - P-2 = 0

FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia

entre las medias de las poblaciones ejemplo 541

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 15: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

entre las medias de las poblacionesel valor de z que corresponde a -13 es

-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy

15 15

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375

lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n

l Yn

2 son diferentes y cuando

las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma

Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~

Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n

l Y n

2 extraidas de esas poblaciones siguen una

distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )

iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )

Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal

EJElUPLO 542

Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas

Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 16: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS

tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia

I1x -x 111 - 112 = 45 30 15

cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40

l 2

El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es

20 15 5 123

~164286 40532

En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542

1093

1093

o 123 z

FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 17: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

FJERCICIOS

541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses

Poblaci6n Edad Media Desviaci6n estandar

A 20-24 180 43

B 25-34 199 49

Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25

542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados

Poblaci6n 1 n l

= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones

543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8

544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12

545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ

sea mayor que 10

5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA

En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 18: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA

EJEMPLO 551

Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15

Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p

EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull

Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p

Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula

A

P P z=-====

(551 )~P(lP)

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 19: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES

La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto

Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de

A

p-p 15-08 07 z=-====- r====--=315

0222

La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio

Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula

x+S -p

Zc =-==-parax ltnp (552)

o bien

x S --p

z = Wn para xgt np pqn (553)

donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y

225 5 08

--=1c=50====-_ = 301 100049

Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 20: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 143

EJEMPLO 552

Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85

Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula

85 90 -05 z = = == -236

V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull

EJERCICIOS

551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0

mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37

552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos

553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA

554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta

555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule

b) Pcp S 58) c) P(56 ~ P~ 63)

556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 21: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS

Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras

DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue

Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de

con variancia

cuando n 1Y n2

son [Jrandes

Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n

2(l - P

2) son mayores que 5

Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias

Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n

J y calcular a partir

de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 22: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145

Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula

(561) Z=-r==============

EJEMPLO 561

Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30

Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de

y variancia

(2

p-p =(33)(67)

100 004711

(5)(5)

100

EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene

(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============

PI(l-PI) P2(I-P2) ~004711 + ------shy

V nl n2

AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull

EJEMPLO 562

Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06

Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 23: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES

00081

El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es

06-0 z = 211

~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull

EjERCICIOS

561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas

562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor

563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20

57 RESUMEN

EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral

1 Distribuci6n de la media de una muestra unica

2 Distribuci6n de la diferencia entre las medias de dos muestras

3 Distribuci6n de la proporci6n de la muestra

4 Distribuci6n de la diferenciaentre las proporciones dedos muestras

Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 24: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

147 PREGUNTAS Y EJERCICIOS DE REIASO

PHEGUNTAS YF-JERCICIOS DE REPASO

1 ~Que es una distribucion muestral

2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion

3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal

4 Explique el teorema del Hmite central

5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo

6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras

7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes

8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des

9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot

10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills

11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33

12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios

13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos

14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras

15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 25: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES

esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero

16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir

17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO

18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras

19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05

20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO

21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral

22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral

23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18

24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral

de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral

25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral

26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29

27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC

Page 26: Daniels Capítulo 5 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

BIBLIOGRAFiA 149

a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal

b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal

c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente

28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no

a) p= 50 n=8 b) P=40 n = 30

c)p 10n = 30 d) P = 01 n 1000

e) p = 90 n = 100 f) P 05 n = 150

BmUOGRAFfA

Bibliografia de metodologia

1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ

2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

Bibliografia de aplicaciones

A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC

A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)

A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC

A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD

A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)

A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)

A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC