NEYMAN Trabajo (2)

17
MUESTREO ALEATORIO ESTRATIFICADO Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos, en k subpoblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio (sexo, grupo de edad, nivel de estudios, lugar geográfico, tamaño del municipio, etc), de tamaños respectivos N1, ..., Nk, y realizando en cada una de estas subpoblaciones muestreos aleatorios simples de tamaño ni. AFIJACIÓN NEYMAN En el año 1934, Dersy Neyman investigo matemáticamente el problema de cal podría ser la distribución de la muestra en los estratos que diera el menor error de muestra posible. Encontró que la respuesta consistía en dejar que la tasa de muestreo en cada estrato variara con la cantidad de variabilidad de cada estrato, en otras palabras hacer la tasa de muestreo en un estrato dado proporcional a la desviación estándar en ese estrato. En esa forma el número de elementos a extraer para la muestra en cada estrato dependería no solo del número total de elementos total del estrado sino también de la desviación estándar de la característica que se va a medir. Para esta afijación óptima el número de elementos que se selecciona en un estrato está dado por la fórmula: Mi= n ( ¿ Si ΣSi )

description

sistema neyman

Transcript of NEYMAN Trabajo (2)

Page 1: NEYMAN Trabajo (2)

MUESTREO ALEATORIO ESTRATIFICADO

Un muestreo aleatorio estratificado es aquel en el que se divide la población de

N individuos, en k subpoblaciones o estratos, atendiendo a criterios que

puedan ser importantes en el estudio (sexo, grupo de edad, nivel de estudios,

lugar geográfico, tamaño del municipio, etc), de tamaños respectivos N1, ...,

Nk, y realizando en cada una de estas subpoblaciones muestreos aleatorios

simples de tamaño ni.

AFIJACIÓN NEYMAN

En el año 1934, Dersy Neyman investigo matemáticamente el problema de cal

podría ser la distribución de la muestra en los estratos que diera el menor error

de muestra posible. Encontró que la respuesta consistía en dejar que la tasa de

muestreo en cada estrato variara con la cantidad de variabilidad de cada

estrato, en otras palabras hacer la tasa de muestreo en un estrato dado

proporcional a la desviación estándar en ese estrato. En esa forma el número

de elementos a extraer para la muestra en cada estrato dependería no solo del

número total de elementos total del estrado sino también de la desviación

estándar de la característica que se va a medir.

Para esta afijación óptima el número de elementos que se selecciona en un

estrato está dado por la fórmula:

Mi=n( ¿SiΣ∋Si )

Con una afijación óptima el error estándar de la media se reduce a:

S x=√ 1n ( ¿ SiN )

2

−¿Si2

N2

Para aplicar este tipo de afijación, es necesario conocer los valores de Sι en el universo.

Page 2: NEYMAN Trabajo (2)

MÉTODO DE NEYMAN

Para realizar un muestreo estratificado por primera vez, lo más práctico es

diseñar un muestreo preliminar exploratorio que permita conocer el valor de los

estimadores de la población y las varianzas de cada estrato. Este primer

muestreo debe de planearse en tamaño de acuerdo a la situación real de la

población (varianzas estimadas) para que no sea necesario incrementar el

número de observaciones una vez que se conocen los datos. En el primer

muestreo se debe calcular el valor n, que es el tamaño de la muestra necesaria

para tener los límites de error preestablecidos. Si n es mayor que la muestra

inicial, entonces es necesario recolectar nuevas observaciones y el método de

Neyman va a ayudar para determinar de qué tamaño debe ser la muestra de

cada estrato. El Método Neyman tiene la ventaja de que incorpora el factor

costo, ya que uno de los objetivos del muestreo es recolectar la mayor cantidad

de información, con mayor precisión y al menor costo. Levantar una encuesta

vía telefónica es evidentemente más barato que levantar una encuesta en un

poblado lejano donde es difícil establecer un medio de comunicación. Método

de Neyman para el cálculo del tamaño de estratos.

FÓRMULA:

n

0h=W hSh

2

V h=W hS h

2

( Ehzh )2 Siendo:

nh=noh

1+nohNh

Notación.

El subíndice h indica el estrato, h=1,2,..., LW h= Nh /N peso del estrato h-ésimo

Sh2 = Varianza para cada estrato

V h = Nh = número de elementos en el estrato h de la población.

nh =número de elementos del estrato h en la muestra.

N = tamaño de la población ∑ N h N

n tamaño de la muestra ∑ n h nyhi = Valor obtenido en la i-ésima unidad del h-ésimo estrato.f h = Nh/ Nh fracción de muestreo en el estrato h-ésimo

NATI(VENTAJAS Y DIREFENCIAS)

Page 3: NEYMAN Trabajo (2)

MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE

ESTRATOS

En el método Neyman es necesario conocer para cada estrato: El tamaño total

(o su estimador), la desviación estándar (que se obtiene de información previa

o de la muestra exploratoria) y el costo de recolectar una encuesta en cada

estrato.

Notación:

N i =Tamaño del estrato

ni=tamaño de la muestra del estrato i

El subíndice i denota la unidad dentro del estrato.

n = tamaño de la muestra

Si2= Varianza muestral del estrato i

C i = Coste de una observación del estrato i

W i = peso del estrato

L= número de estratos

N=Tamaño de la población

µi = media poblacional del estrato

τ i = total poblacional del estrato i

σ i2=varianza poblacional del estrato i

y i= media muestral del estrato i

p̂i=proporción muestral del estrato i

Page 4: NEYMAN Trabajo (2)

MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE

ESTRATOS

En el método Neyman es necesario conocer para cada estrato: El tamaño total (o su

estimador), la desviación estándar (que se obtiene de información previa o de la

muestra exploratoria) y el costo de recolectar una encuesta en cada estrato.

Los datos se pueden concentrar en una tabla.

El siguiente paso es calcular la ecuación que se muestra para cada estrato en una columna extra.

Ni si ci Nisi/√ci

Estrato 1 1170 8.2 3.00 5539.10

Estrato 2 980 8.0 2.80 4685.30

Estrato 3 920 8.2 3.00 4355.53

Estrato 4 1210 7.6 3.30 5062.23

∑ 19642.16

Para continuar con los cálculos es necesario sumar la columna recién calculada

Para cada estrato se calcula el valor wi

Page 5: NEYMAN Trabajo (2)

Ni Si ci Nisi/√ci wi

Estrato 1 1170 8.2 3.00 5539.10 0.282

Estrato 2 980 8.0 2.80 4685.30 0.239

Estrato 3 920 8.2 3.00 4355.53 0.222

Estrato 4 1210 7.6 3.30 5062.23 0.258

∑ 19642.16

El último paso es multiplicar cada valor wi por n (tamaño de la muestra total) y se tendrá el tamaño de la muestra de cada estrato.

Ni Si Ci Nisi/√ci Wi Si n=65

ni

Estrato 1 1170 8.2 3.00 5539.10 0.282 18.33

Estrato 2 980 8.0 2.80 4685.30 0.239 15.50

Estrato 3 920 8.2 3.00 4355.53 0.222 14.41

Estrato 4 1210 7.6 3.30 5062.23 0.258 16.75

∑ 19642.16

ERCICIOS PROPUESTOS

En una población cuyas características son conocidas:

Estrato W S

I 0,45 4

II 0,35 5

III 0,20 6

Page 6: NEYMAN Trabajo (2)

E1= 0,8 E2= 1,02 E3= 2

Z= 1,96 N= 200

Determinar el tamaño de la muestra, de acuerdo al Método de Asignación de Neyman.

DESARROLLO:

Para ello debemos tener en cuenta la siguiente fórmula:

Para el I ESTRATO:

1. Hallar n1

n°1=W 1S1

2

¿¿ ¿

n°1=43, 218

2. HallarN1=W ×N

N1= 200 (0,45)

N1 = 90

3. Hallar el tamaño de muestra corregido

n

1=n°1

1+n°1

N1

n1=¿ 43 ,218

1+43,21890

¿

n1=¿ ¿ 29

Para el II ESTRATO:

1. Hallar n2

n° 2=W 2S2

2

¿¿ ¿

(0.35 )(5)2

( 1,021,96 )

2

n° 2=¿32, 31

Para el III ESTRATO:

Page 7: NEYMAN Trabajo (2)

1. Hallar n3

n°3=W 3S3

2

¿¿ ¿

n°3=¿6, 91

2. Hallar N2=W ×N

N2= 200 (0,35)

N2 = 70

3. Hallar el tamaño de muestra corregido

n2=¿ 32 ,31

1+32,3170

¿

n2=¿ ¿22

2. Hallar N3=W ×N

N3= 200 (0,20)

N3= 40

3. Hallar el tamaño de muestra corregido

n3=¿ 6 , 91

1+6,9140

¿

n3=¿ ¿6

MUESTREO ESTARFICADO CON ASIGNACIÓN DE NEYMAN

Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos, es recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. De esta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos.

Tamaño de muestra para estimar la media con asignación de Neyman

Page 8: NEYMAN Trabajo (2)

n=(∑h=1

L

NhSh)2

N 2 B2

K 2 +∑h=1

L

NhSh2

(6.30)

Para repartir la muestra entre los estratos se utiliza la siguiente expresión:

ni=(N iS i)

∑h=1

L

N i Si (6.31)

EJEMPLO:

Se desea hacer un estudio sobre producción media de madera aserrada en los EE.UU.

Todos los aserradores han sido agrupados en estratos, de acuerdo con la producción. Hace 5 años se hizo un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla). Por lo tanto, se dispone de la siguiente información:

Estrato Producción anual

N° aserraderos Desviación Estándar

1 5,000 Y + 538 9,0002 1,000-4,999 4,756 1,2003 Menos de 1,000 30,964 300

Determine el tamaño de muestra necesario para estimar la producción media de madera con un error máximo de 25,000 pies de tabla y una confiabilidad del 95%

Solución:

N1=538 N2=4,756 N3=30,964 N= 36,258

B=25,0001,000

=25 k=1.96

Page 9: NEYMAN Trabajo (2)

El error máximo es de 25,000 pies, pero se debe tener en cuenta que la producción está dada en miles, por lo tanto se divide por 1.000, es decir que B=25

Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con muestreo estratificado con la asignación de Neyman. Para determinar el tamaño de la muestra se utiliza la ecuación 6.30 y para repartir la muestra en los estratos se usa la ecuación 6.31

Se debe tomar una muestra de 1,473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato dos y 690 en el estrato tres.

n=[538 (9,000 )+4,756 (1,200 )+30,964 (300 ) ]2

36,2582 252

1.962 +[538 (9,000 )2+4,756 (1,200 )2+30,964 (300 )2 ]=1,1473.49

Tamaño de muestra para estimar el total con asignación de Neyman

n=(∑h=1

L

NhSh)2

B2

K2 +∑h=1

L

N hSh2

(6.32)

La muestra se reparte entre los estratos utilizando la expresión 6.31

Ejemplo:

La fábrica de tapas, desea determinar el tamaño de muestra necesario para estimar la producción total, con un error máximo de 90,000 tapas y una confiabilidad del 95%

Solución:

Se considera que la información suministrada en el ejemplo 6.7 corresponde a una muestra piloto, de la cual se utilizan las varianzas obtenidas que son :

I 12=180,833.33 I 2

2=2 ´ 572,000 I 32=1 ´ 0570,000

Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el tamaño de dichos estratos, el tipo de muestreo adecuado es el estratificado con asignación de Neyman.

Page 10: NEYMAN Trabajo (2)

La fórmula para calcular el tamaño de la muestra es la 6.32 y para reapartirla en los estratos, se utiliza la ecuación 6.31

N1=240 N2=100 N3=60 N= 400

B=90,000 k=1.96

n=[240 (425.425 )+100 (1,603.7456 )+60(3,251.1536)]2

90,0002

1,962 +240 (180,833.33 )+100 (2´ 572,000 )+60(1 ´ 0570,000)=68.78

n1=69[ 240 (425.445)457,502.5801 ]=15,39

n2=69[100 (1,603.7456)457,502.5801 ]=24.19

n3=69[ 60 (3,251.1536)457,502.5801 ]=29,42

Por lo tanto, estimar la producción total con un error máximo de 90,000 tapas y una confiabilidad del 95%, se debe seleccionar una muestra de 69 máquinas, repartirlas asi: 15 manuales, 24 semiautomáticas y 30 automáticas

Tamaño de muestra para estimar la proporción con asignación de Neyman

n=(∑h=1

L

Nh√ phqh)2

N 2 B2

K 2 +∑h=1

L

Nh phqh

(6.33)

Para estimar la muestra entre los estratos se utiliza la expresión:

ni=n[ (N i√ phqh )2

B2

K2 +N h√ phqh ] (6.34)

Muestreo estratificado con asignación óptima: Cuando además de tener marcadas diferencias en la dispersión o variabilidad dentro de los estratos, el

Page 11: NEYMAN Trabajo (2)

costo para obtener la información de un estrato a otro varía, se recomienda utilizar la asignación óptima. Con ésta asignación se tiene en cuenta el tamaño de los estratos, la dispersión o variabilidad dentro de ellos y el costo para recopilar la información.

Tamaño de muestra para obtener la media con asignación óptima

Dónde: ch = costo de hacer una observación individual en el estrato h.

Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión

Tamaño de muestra para obtener el total con asignación óptima

Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión

Tamaño de muestra para estimar la proporción con asignación óptima

Page 12: NEYMAN Trabajo (2)

Dónde: ch = costo de hacer una observación individual en el estrato h.

La muestra se reparte entre los distintos estratos, utilizando la expresión

TEOREMA

[Asignación de Neyman] Sea E una población con N elementos, dividida en k estratos, con Ni elementos cada uno de ellos ,i=1,…,k

Sea n el número total de elementos al realizar el muestreo, y que se dividen en cada estrato como

Sea X la v.a. que representa el carácter que intentamos estudiar. Sobre cada estrato puede definirse entonces la v.a.

Como el valor medio de X obtenida en una muestra de tamaño ni en el estrato Ei. Sea Var[Xi] la varianza de dicha v.a.; Entonces

Page 13: NEYMAN Trabajo (2)

Se minimiza cuando

Donde