NEYMAN Trabajo (2)
-
Upload
giuliana-stephany-laura-yaya -
Category
Documents
-
view
215 -
download
0
description
Transcript of NEYMAN Trabajo (2)
MUESTREO ALEATORIO ESTRATIFICADO
Un muestreo aleatorio estratificado es aquel en el que se divide la población de
N individuos, en k subpoblaciones o estratos, atendiendo a criterios que
puedan ser importantes en el estudio (sexo, grupo de edad, nivel de estudios,
lugar geográfico, tamaño del municipio, etc), de tamaños respectivos N1, ...,
Nk, y realizando en cada una de estas subpoblaciones muestreos aleatorios
simples de tamaño ni.
AFIJACIÓN NEYMAN
En el año 1934, Dersy Neyman investigo matemáticamente el problema de cal
podría ser la distribución de la muestra en los estratos que diera el menor error
de muestra posible. Encontró que la respuesta consistía en dejar que la tasa de
muestreo en cada estrato variara con la cantidad de variabilidad de cada
estrato, en otras palabras hacer la tasa de muestreo en un estrato dado
proporcional a la desviación estándar en ese estrato. En esa forma el número
de elementos a extraer para la muestra en cada estrato dependería no solo del
número total de elementos total del estrado sino también de la desviación
estándar de la característica que se va a medir.
Para esta afijación óptima el número de elementos que se selecciona en un
estrato está dado por la fórmula:
Mi=n( ¿SiΣ∋Si )
Con una afijación óptima el error estándar de la media se reduce a:
S x=√ 1n ( ¿ SiN )
2
−¿Si2
N2
Para aplicar este tipo de afijación, es necesario conocer los valores de Sι en el universo.
MÉTODO DE NEYMAN
Para realizar un muestreo estratificado por primera vez, lo más práctico es
diseñar un muestreo preliminar exploratorio que permita conocer el valor de los
estimadores de la población y las varianzas de cada estrato. Este primer
muestreo debe de planearse en tamaño de acuerdo a la situación real de la
población (varianzas estimadas) para que no sea necesario incrementar el
número de observaciones una vez que se conocen los datos. En el primer
muestreo se debe calcular el valor n, que es el tamaño de la muestra necesaria
para tener los límites de error preestablecidos. Si n es mayor que la muestra
inicial, entonces es necesario recolectar nuevas observaciones y el método de
Neyman va a ayudar para determinar de qué tamaño debe ser la muestra de
cada estrato. El Método Neyman tiene la ventaja de que incorpora el factor
costo, ya que uno de los objetivos del muestreo es recolectar la mayor cantidad
de información, con mayor precisión y al menor costo. Levantar una encuesta
vía telefónica es evidentemente más barato que levantar una encuesta en un
poblado lejano donde es difícil establecer un medio de comunicación. Método
de Neyman para el cálculo del tamaño de estratos.
FÓRMULA:
n
0h=W hSh
2
V h=W hS h
2
( Ehzh )2 Siendo:
nh=noh
1+nohNh
Notación.
El subíndice h indica el estrato, h=1,2,..., LW h= Nh /N peso del estrato h-ésimo
Sh2 = Varianza para cada estrato
V h = Nh = número de elementos en el estrato h de la población.
nh =número de elementos del estrato h en la muestra.
N = tamaño de la población ∑ N h N
n tamaño de la muestra ∑ n h nyhi = Valor obtenido en la i-ésima unidad del h-ésimo estrato.f h = Nh/ Nh fracción de muestreo en el estrato h-ésimo
NATI(VENTAJAS Y DIREFENCIAS)
MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE
ESTRATOS
En el método Neyman es necesario conocer para cada estrato: El tamaño total
(o su estimador), la desviación estándar (que se obtiene de información previa
o de la muestra exploratoria) y el costo de recolectar una encuesta en cada
estrato.
Notación:
N i =Tamaño del estrato
ni=tamaño de la muestra del estrato i
El subíndice i denota la unidad dentro del estrato.
n = tamaño de la muestra
Si2= Varianza muestral del estrato i
C i = Coste de una observación del estrato i
W i = peso del estrato
L= número de estratos
N=Tamaño de la población
µi = media poblacional del estrato
τ i = total poblacional del estrato i
σ i2=varianza poblacional del estrato i
y i= media muestral del estrato i
p̂i=proporción muestral del estrato i
MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE
ESTRATOS
En el método Neyman es necesario conocer para cada estrato: El tamaño total (o su
estimador), la desviación estándar (que se obtiene de información previa o de la
muestra exploratoria) y el costo de recolectar una encuesta en cada estrato.
Los datos se pueden concentrar en una tabla.
El siguiente paso es calcular la ecuación que se muestra para cada estrato en una columna extra.
Ni si ci Nisi/√ci
Estrato 1 1170 8.2 3.00 5539.10
Estrato 2 980 8.0 2.80 4685.30
Estrato 3 920 8.2 3.00 4355.53
Estrato 4 1210 7.6 3.30 5062.23
∑ 19642.16
Para continuar con los cálculos es necesario sumar la columna recién calculada
Para cada estrato se calcula el valor wi
Ni Si ci Nisi/√ci wi
Estrato 1 1170 8.2 3.00 5539.10 0.282
Estrato 2 980 8.0 2.80 4685.30 0.239
Estrato 3 920 8.2 3.00 4355.53 0.222
Estrato 4 1210 7.6 3.30 5062.23 0.258
∑ 19642.16
El último paso es multiplicar cada valor wi por n (tamaño de la muestra total) y se tendrá el tamaño de la muestra de cada estrato.
Ni Si Ci Nisi/√ci Wi Si n=65
ni
Estrato 1 1170 8.2 3.00 5539.10 0.282 18.33
Estrato 2 980 8.0 2.80 4685.30 0.239 15.50
Estrato 3 920 8.2 3.00 4355.53 0.222 14.41
Estrato 4 1210 7.6 3.30 5062.23 0.258 16.75
∑ 19642.16
ERCICIOS PROPUESTOS
En una población cuyas características son conocidas:
Estrato W S
I 0,45 4
II 0,35 5
III 0,20 6
E1= 0,8 E2= 1,02 E3= 2
Z= 1,96 N= 200
Determinar el tamaño de la muestra, de acuerdo al Método de Asignación de Neyman.
DESARROLLO:
Para ello debemos tener en cuenta la siguiente fórmula:
Para el I ESTRATO:
1. Hallar n1
n°1=W 1S1
2
¿¿ ¿
n°1=43, 218
2. HallarN1=W ×N
N1= 200 (0,45)
N1 = 90
3. Hallar el tamaño de muestra corregido
n
1=n°1
1+n°1
N1
n1=¿ 43 ,218
1+43,21890
¿
n1=¿ ¿ 29
Para el II ESTRATO:
1. Hallar n2
n° 2=W 2S2
2
¿¿ ¿
(0.35 )(5)2
( 1,021,96 )
2
n° 2=¿32, 31
Para el III ESTRATO:
1. Hallar n3
n°3=W 3S3
2
¿¿ ¿
n°3=¿6, 91
2. Hallar N2=W ×N
N2= 200 (0,35)
N2 = 70
3. Hallar el tamaño de muestra corregido
n2=¿ 32 ,31
1+32,3170
¿
n2=¿ ¿22
2. Hallar N3=W ×N
N3= 200 (0,20)
N3= 40
3. Hallar el tamaño de muestra corregido
n3=¿ 6 , 91
1+6,9140
¿
n3=¿ ¿6
MUESTREO ESTARFICADO CON ASIGNACIÓN DE NEYMAN
Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos, es recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. De esta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos.
Tamaño de muestra para estimar la media con asignación de Neyman
n=(∑h=1
L
NhSh)2
N 2 B2
K 2 +∑h=1
L
NhSh2
(6.30)
Para repartir la muestra entre los estratos se utiliza la siguiente expresión:
ni=(N iS i)
∑h=1
L
N i Si (6.31)
EJEMPLO:
Se desea hacer un estudio sobre producción media de madera aserrada en los EE.UU.
Todos los aserradores han sido agrupados en estratos, de acuerdo con la producción. Hace 5 años se hizo un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla). Por lo tanto, se dispone de la siguiente información:
Estrato Producción anual
N° aserraderos Desviación Estándar
1 5,000 Y + 538 9,0002 1,000-4,999 4,756 1,2003 Menos de 1,000 30,964 300
Determine el tamaño de muestra necesario para estimar la producción media de madera con un error máximo de 25,000 pies de tabla y una confiabilidad del 95%
Solución:
N1=538 N2=4,756 N3=30,964 N= 36,258
B=25,0001,000
=25 k=1.96
El error máximo es de 25,000 pies, pero se debe tener en cuenta que la producción está dada en miles, por lo tanto se divide por 1.000, es decir que B=25
Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con muestreo estratificado con la asignación de Neyman. Para determinar el tamaño de la muestra se utiliza la ecuación 6.30 y para repartir la muestra en los estratos se usa la ecuación 6.31
Se debe tomar una muestra de 1,473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato dos y 690 en el estrato tres.
n=[538 (9,000 )+4,756 (1,200 )+30,964 (300 ) ]2
36,2582 252
1.962 +[538 (9,000 )2+4,756 (1,200 )2+30,964 (300 )2 ]=1,1473.49
Tamaño de muestra para estimar el total con asignación de Neyman
n=(∑h=1
L
NhSh)2
B2
K2 +∑h=1
L
N hSh2
(6.32)
La muestra se reparte entre los estratos utilizando la expresión 6.31
Ejemplo:
La fábrica de tapas, desea determinar el tamaño de muestra necesario para estimar la producción total, con un error máximo de 90,000 tapas y una confiabilidad del 95%
Solución:
Se considera que la información suministrada en el ejemplo 6.7 corresponde a una muestra piloto, de la cual se utilizan las varianzas obtenidas que son :
I 12=180,833.33 I 2
2=2 ´ 572,000 I 32=1 ´ 0570,000
Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el tamaño de dichos estratos, el tipo de muestreo adecuado es el estratificado con asignación de Neyman.
La fórmula para calcular el tamaño de la muestra es la 6.32 y para reapartirla en los estratos, se utiliza la ecuación 6.31
N1=240 N2=100 N3=60 N= 400
B=90,000 k=1.96
n=[240 (425.425 )+100 (1,603.7456 )+60(3,251.1536)]2
90,0002
1,962 +240 (180,833.33 )+100 (2´ 572,000 )+60(1 ´ 0570,000)=68.78
n1=69[ 240 (425.445)457,502.5801 ]=15,39
n2=69[100 (1,603.7456)457,502.5801 ]=24.19
n3=69[ 60 (3,251.1536)457,502.5801 ]=29,42
Por lo tanto, estimar la producción total con un error máximo de 90,000 tapas y una confiabilidad del 95%, se debe seleccionar una muestra de 69 máquinas, repartirlas asi: 15 manuales, 24 semiautomáticas y 30 automáticas
Tamaño de muestra para estimar la proporción con asignación de Neyman
n=(∑h=1
L
Nh√ phqh)2
N 2 B2
K 2 +∑h=1
L
Nh phqh
(6.33)
Para estimar la muestra entre los estratos se utiliza la expresión:
ni=n[ (N i√ phqh )2
B2
K2 +N h√ phqh ] (6.34)
Muestreo estratificado con asignación óptima: Cuando además de tener marcadas diferencias en la dispersión o variabilidad dentro de los estratos, el
costo para obtener la información de un estrato a otro varía, se recomienda utilizar la asignación óptima. Con ésta asignación se tiene en cuenta el tamaño de los estratos, la dispersión o variabilidad dentro de ellos y el costo para recopilar la información.
Tamaño de muestra para obtener la media con asignación óptima
Dónde: ch = costo de hacer una observación individual en el estrato h.
Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión
Tamaño de muestra para obtener el total con asignación óptima
Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión
Tamaño de muestra para estimar la proporción con asignación óptima
Dónde: ch = costo de hacer una observación individual en el estrato h.
La muestra se reparte entre los distintos estratos, utilizando la expresión
TEOREMA
[Asignación de Neyman] Sea E una población con N elementos, dividida en k estratos, con Ni elementos cada uno de ellos ,i=1,…,k
Sea n el número total de elementos al realizar el muestreo, y que se dividen en cada estrato como
Sea X la v.a. que representa el carácter que intentamos estudiar. Sobre cada estrato puede definirse entonces la v.a.
Como el valor medio de X obtenida en una muestra de tamaño ni en el estrato Ei. Sea Var[Xi] la varianza de dicha v.a.; Entonces
Se minimiza cuando
Donde