EFICIENCIA DE LOS MÉTODOS DE ASIGNACIÓN DE … · AGRADECIMIENTOS A la Secretaría de Educación...

COLEGIO DE POSTGRADUADOS

INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN EN CIENCIAS AGRÍCOLAS

CAMPUS MONTECILLO

SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA ESTADÍSTICA

EFICIENCIA DE LOS MÉTODOS DE ASIGNACIÓN DE NEYMAN Y PROPORCIONAL EN EL MUESTREO

ALEATORIO ESTRATIFICADO

ROSENDO ARTURO VELÁSQUEZ CABRERA

T E S I S PRESENTADA COMO REQUISITO PARCIAL PARA

OBTENER EL GRADO DE:

MAESTRO EN CIENCIAS

MONTECILLO, TEXCOCO, EDO. DE MÉXICO 2005

La presente tesis titulada: Eficiencia de los métodos de asignación de Neyman y Proporcional en el Muestreo Aleatorio Estratificado, realizada por el alumno: Rosendo Arturo Velásquez Cabrera, bajo la dirección del consejo particular indicado, ha sido aprobada por el mismo y aceptada como requisito parcial para obtener el grado de:

MAESTRO EN CIENCIAS SOCIOECONOMÍA, ESTADISTICA E INFORMÁTICA

ESTADÍSTICA

CONSEJO PARTICULAR CONSEJERO

DR. GILBERTO RENDÓN SÁNCHEZ

_________________

ASESOR

DR. VICENTE GONZÁLEZ ROMERO

_________________

ASESOR

DR. LUIS LANDOIS PALENCIA

_________________

MONTECILLO, TEXCOCO, EDO. DE MÉXICO 2005

AGRADECIMIENTOS

A la Secretaría de Educación Pública, a la Subsecretaría de Educación e Investigación Tecnológicas y al Consejo del Sistema de Educación Tecnológica por permitir dedicarme de tiempo completo al logro de este objetivo. Al Consejo Nacional de Ciencia y Tecnología por el apoyo brindado. A la Dirección de General de Educación Tecnológica Agropecuaria por la oportunidad que proporciona a sus trabajadores para poder superarse y ser mejores en el diario quehacer de la educación. Al Instituto Tecnológico Agropecuario No. 23 de Oaxaca por la formación que me ha dado y por arroparme en su espacio laboral. Al Dr. Salvador Lozano Trejo por brindarme las facilidades necesarias para poder emprender esta tarea. Al Colegio de Postgraduados por permitirme entrar a un recinto tan importante en la investigación agrícola de Latinoamérica. Al Instituto de Socioeconomía Estadística e Informática, en particular a los valiosos profesores del Programa en Estadística, sus enseñanzas han sido importantes para mí. Al Dr. Gilberto Rendón Sánchez por sus atinadas sugerencias para la realización de este trabajo, y sobre todo por representar un valuarte en la investigación sobre muestreo estadístico. Al Dr. Luis Landois Palencia por disponibilidad y valiosos comentarios para el enriquecimiento de esta tesis. Al Dr. Vicente González Romero por sus valiosas aportaciones al presente trabajo y por su apoyo para la realización del mismo. A las secretarias y a todos los trabajadores administrativos del ISEI, desde el primer día en el CP conté con su apoyo.

A Dios

DEDICATORIA A Sarahí, gracias por tu amor, apoyo y paciencia, sin ti negrita no hubiera iniciado esta aventura A mi hijo, Arturo, discúlpame si por cumplir con este objetivo te he hecho falta. Te amo A mis padres Rosendo Arturo y Alicia, por todo el amor y apoyo que siempre me han brindado. A mi hermano Víctor Hugo

A mis tíos Martha Elvia, Luis, Conchita, Toño, Zenén, Magdiel, Teresa, Roberto, Delfino, Lucila, Eira, Luz y Martha A mis primos Luis Rodrigo, Ariana, Martín Rolando, Héctor Julio, Indira, David Arturo, Magdiel, Olga, Máximo, Juan, Aída, Jorge, Yolanda, Amelia, Eduardo, Julissa, Abimelec, Bricia, Lorena, Adriana, Memo, Fernando, Tino, Norma, Sara y Esmeralda. A mis sobrinos Mara Alicia, Máximo Valente, Eugenia Guadalupe, Diana, Samantha, Viridiana, Jessica, Juanito, Miriam, Julio, Eric, Alan, Geovany, Gema, Cintia, Dixie, Caty y Héctor. A Celina, Mara Margarita, Sonia, Alonso, Arturo y Delia A mis amigos Jacobo, Gisela, Dalma, Ethel, Romeo, Adrián, Neto, Isidro, Max, Víctor, Alan, Pepe, Toño, Tino, Ayuso, Elmer, Paco, Joaquín, Omar. A mis compañeros del programa de estadística: Nayeli, Ana, Pedro, Jaime, Jesús Manuel, Jesús Flores, José Guadalupe, Eddy, Felipe y Miguel Ángel.

A Máximo Valente†

CONTENIDO

Pág. CONTENIDO .....................................................................................................................i ÍNDICE DE CUADROS Y FIGURAS............................................................................ iii RESUMEN........................................................................................................................vi ABSTRACT.....................................................................................................................vii I. INTRODUCCIÓN......................................................................................................1

1.1. Objetivo general ..................................................................................................3

1.1.1. Objetivos particulares......................................................................................3 1.2. Hipótesis..............................................................................................................3

II. REVISIÓN DE LITERATURA.................................................................................5 2.1. Muestreo Aleatorio Estratificado. .......................................................................5

2.1.1. Estimación de la media poblacional.................................................................7 2.1.2. Tamaño de muestra a seleccionar en los diferentes estratos. ...........................8 2.1.3. Funciones de varianza. ...................................................................................12

2.2. Dificultades prácticas para aplicar la asignación de Neyman. ..............................13

2.2.1. Interrogantes planteadas en la principal dificultad.........................................13 2.2.2. Solución a las interrogantes planteadas..........................................................14

III. METODOLOGÍA .....................................................................................................21 3.1. Población...............................................................................................................21

3.2. Muestreo................................................................................................................22

3.3. Análisis..................................................................................................................24

IV. RESULTADOS Y DISCUSIÓN ...............................................................................27 4.1 Programas generados .............................................................................................27

4.2. Distribución Normal..............................................................................................28

4.3. Distribución Ji-cuadrada. ......................................................................................34

4.4. Distribución Gama. ...............................................................................................40

4.5. Distribución Poisson. ............................................................................................46

4.6. Consideraciones Generales. ..................................................................................52

V. CONCLUSIONES ......................................................................................................54 BIBLIOGRAFÍA .............................................................................................................56 ANEXO 1.........................................................................................................................58 ANEXO 2.........................................................................................................................66 ANEXO 3.........................................................................................................................69

ÍNDICE DE CUADROS Y FIGURAS

CUADROS Pág.

Cuadro 1. Distribuciones y sus parámetros a partir de las cuales se generaron las

doce poblaciones utilizadas.................................................................................... 22 Cuadro 2. Distribución de la muestra preliminar en los diferentes estratos, según la

población con media de 100 y desviación estándar de 25. .................................... 23 Cuadro 3. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños

de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones normales bajo estudio. ..................................... 28

Cuadro 4. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones normales. ............................................................................ 30

Cuadro 5. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones normales bajo estudio......................................................... 31

Cuadro 6. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio................................... 35

Cuadro 7. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio. .................................................... 36

Cuadro 8. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio. .................................................... 38

Cuadro 9. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio............................................ 41

Cuadro 10. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio.............................................................. 42

Cuadro 11. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio.............................................................. 43

Cuadro 12. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio. ....................... 47

Cuadro 13. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio. .......................................................... 48

Cuadro 14. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio. .......................................................... 49

FIGURAS Pág.

Figura 1. Índices de la eficiencia del diseño de muestreo considerando el promedio

de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 25............................ 32

Figura 2. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 50............................ 33

Figura 3. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 75............................ 33

Figura 4. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Ji-cuadrada con 100 grados de libertad. ..................................................................... 39

Figura 7. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Gama con parámetro α igual a 5. ........................................................................... 44

Figura 8. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Gama con parámetro α igual a 10.......................................................................... 45

Figura 9. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Gama con parámetro α igual a 20.......................................................................... 45

Figura 10. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Poisson con parámetro λ igual a 200..................................................... 50

Figura 11. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Poisson con parámetro λ igual a 200..................................................... 51

Figura 12. Índices de la eficiencia del diseño de muestreo considerando el promedio de las varianzas estimadas de Neyman, la varianza proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Poisson con parámetro λ igual a 200. .................................................................... 51

RESUMEN

En el presente estudio se comparó la eficiencia de los estimadores de la media obtenidos a través de los métodos de asignación de Neyman y Proporcional del Muestreo Aleatorio Estratificado; así como la eficiencia de los mismos estimadores bajo asignación Proporcional y bajo la asignación de Neyman al estimar la varianza de los estratos (nueva varianza de Neyman). Para ello se generaron, a través de simulación, cuatro poblaciones con distribución Normal, cuatro con distribución Ji-cuadrada, cuatro con distribución Gama y cuatro con distribución Poisson. Por ser la media un estimador insesgado de la varianza, se utilizaron como indicadores de la eficiencia la diferencia entre las varianzas consideradas y el cociente de estas varianzas, también conocido como indicador de la eficiencia del diseño. Los resultados proporcionan, entre otras, las siguientes conclusiones, en poblaciones con diferentes distribuciones de probabilidad, la asignación de Neyman es más eficiente que la asignación Proporcional, independientemente del tamaño de muestra total fijo; la varianza censal del estimador de la media bajo asignación de Neyman, en general, fue menor que el promedio de la “nueva varianza de Neyman”. En general, para las poblaciones Normal, Ji-cuadrada, Gama y Poisson, puede afirmarse que la asignación de Neyman bajo estimación de las desviaciones estándares de los estratos proporciona, en promedio, estimadores de la media más precisos que los obtenidos a través de la asignación Proporcional, para tamaños de muestra preliminar moderadamente pequeños. En poblaciones normales heterogéneas es necesario un tamaño de muestra preliminar más grande o un mayor número de estratos para que, en promedio, los estimadores de la asignación de Neyman sean más precisos que los de la asignación proporcional. Palabras claves: Índice de eficiencia, precisión, tamaño de muestra.

ABSTRACT

I. INTRODUCCIÓN

Existen diferentes métodos de muestreo probabilístico, cuya selección dependerá

principalmente de los objetivos de la investigación, de las características de interés y de

la estructura de la población bajo estudio.

Por otra parte, para incrementar la precisión de los estimadores se tienen dos

alternativas, incrementar el tamaño de muestra o disminuir la variabilidad de los

estimadores. En el primer caso, al incrementarse el tamaño de muestra, se eleva el costo,

lo cual contradice el objetivo de la teoría del muestreo, lograr que el muestreo sea

eficiente. Por lo tanto, lo más razonable es disminuir la variabilidad de los estimadores.

Con la aplicación del muestreo estratificado, en muchas ocasiones, se puede incrementar

la precisión de los estimadores, sin aumentar el tamaño de muestra; sino más bien

disminuyendo la variabilidad del estimador.

En particular el denominado Muestreo Aleatorio Estratificado (MAE) consiste en dividir

a la población en subpoblaciones denominadas estratos, y posteriormente, seleccionar

una muestra aleatoria simple de cada estrato en forma independiente. Si los estratos se

construyen de tal manera que sean homogéneos dentro y heterogéneos entre estratos,

entonces, el MAE resulta más preciso que el Muestreo Aleatorio Simple (MAS), sin

necesidad de aumentar el tamaño de muestra. Esto se debe a que, en tal situación, la

varianza del estimador bajo MAE disminuye con relación a la varianza del estimador

bajo MAS.

Para determinar en el MAE el tamaño de muestra en cada estrato, existen dos

procedimientos ampliamente utilizados en la práctica, los cuales se basan en la

consideración de contar con un tamaño de muestra total, dado de antemano. Estos

métodos se denominan asignación de Neyman y asignación Proporcional. En la

asignación de Neyman la determinación de los tamaños de muestra en cada estrato

depende, entre otros factores, de las desviaciones estándares poblacionales de los

estratos; mientras que la asignación proporcional no depende de tales desviaciones.

Teóricamente, se puede demostrar que la asignación de Neyman es más eficiente que la

asignación proporcional.

La asignación de Neyman presenta algunas dificultades prácticas para su uso, las cuales

han sido mencionadas por Sukhatme (1962). Una de las dificultades, a las que se refiere

el autor antes mencionado, es el desconocimiento de las desviaciones estándares

paramétricas de los estratos.

Esta limitación se puede evitar al estimar las desviaciones estándares mediante el uso de

una muestra preliminar de tamaño n′ , la cual se distribuye entre los estratos en forma

proporcional para realizar las estimaciones mencionadas. Sin embargo, las estimaciones

de las desviaciones estándares están sujetas a error, además de que son sesgadas, con lo

cual, puede suceder que el método de asignación de Neyman sea menos eficiente que el

de asignación proporcional.

Este problema ha sido abordado, entre otros, por Evans (1951), Sukhatme (1962) y

Rendón (1976) quienes han propuesto principalmente soluciones teóricas, además de

considerar únicamente poblaciones con distribución normal. Por otro lado, en la

literatura revisada no se reporta el uso de herramientas computacionales como la

simulación y su aplicación en poblaciones con distribuciones probabilísticas diferentes a

la normal.

Con base en lo expuesto, para el presente trabajo se plantean los siguientes objetivos:

1.1. Objetivo general

Comparar la eficiencia de los métodos de asignación de Neyman y Proporcional del

muestreo aleatorio estratificado, mediante el uso de simulación y bajo poblaciones con

diferentes distribuciones de probabilidad.

1.1.1. Objetivos particulares.

a) Verificar de manera censal que la asignación de Neyman es más eficiente que la

Proporcional, lo cual se ilustra en poblaciones con diferentes distribuciones de

probabilidad.

b) Mostrar el comportamiento de la varianza del estimador bajo la asignación de

Neyman, cuando para distribuir la muestra total se estiman las desviaciones

estándares mediante una muestra preliminar, considerando diferentes

distribuciones probabilísticas.

c) Comparar la eficiencia de los métodos de asignación de Neyman y Proporcional;

cuando, para el método de Neyman, se hace la distribución de la muestra total

con base en las desviaciones estándares estimadas a partir de una muestra

preliminar; lo que se ilustra en poblaciones con diferentes distribuciones de

probabilidad.

1.2. Hipótesis

Se establecen las siguientes hipótesis con relación a los objetivos particulares:

a) La asignación de Neyman es más eficiente que la proporcional al considerar las

varianzas paramétricas de las medias poblacionales, independientemente del tipo

de distribución probabilística de la población.

b) El incremento en la varianza del estimador, bajo la asignación de Neyman, tiende a

disminuir cuando se incrementa el tamaño de muestra preliminar para estimar las

desviaciones estándares de los estratos, independientemente de la distribución de

probabilidades de la población.

c) La asignación de Neyman, al usar una muestra preliminar para estimar las

desviaciones estándares de los estratos, en la distribución de la muestra total,

resulta más eficiente que la asignación proporcional, independientemente de la

distribución probabilística de la población.

II. REVISIÓN DE LITERATURA

Al inicio del presente capítulo, se desarrollan las bases de la teoría del Muestreo

Aleatorio Estratificado para establecer los conceptos y notación a utilizar.

2.1. Muestreo Aleatorio Estratificado.

Rendón (1976) señala que la selección de un diseño de muestreo está en función de los

objetivos de la investigación, de las características de interés y de la estructura de la

población en estudio. Señala además que cuando se tiene una población heterogénea es

posible dividirla en subpoblaciones mutuamente excluyentes denominadas estratos.

Estos estratos deben ser homogéneos dentro de ellos y heterogéneos entre sí. Esta

técnica se considera una herramienta para reducir la variación.

Sukhatme (1962) indica que la precisión de la estimación de la media poblacional

depende de dos factores: a) el tamaño de la muestra, y b) la variabilidad o

heterogeneidad de la población. Por ello, aparte del tamaño de muestra, la única manera

de aumentar la precisión de una estimación, es diseñar procedimientos de muestreo que

reduzcan la heterogeneidad. Uno de estos procedimientos es el muestreo aleatorio

estratificado.

El mismo autor señala que el muestreo aleatorio estratificado consiste en dividir la

población en k clases y obtener muestras aleatorias independientes de tamaños

conocidos de cada uno de los estratos. El proceso garantiza cualquier representación

deseada en la muestra de todos los estratos en la población, ya que en muestreo aleatorio

simple, no siempre puede asegurarse una representación adecuada de todos los estratos,

y una muestra puede distribuirse de manera tal que alguno de los estratos puede estar

representado excesivamente, en tanto que otros pueden, incluso, no estar presentes. El

procedimiento de muestreo estratificado tiene por objeto dar una mejor representación

de la población, que la que proporciona el muestreo aleatorio simple.

Cochran (1948) describe que este tipo de muestreo (MAE) sigue el procedimiento

general del muestreo aleatorio simple, tomando un paso preliminar. La población de

tamaño N es primeramente dividida en subpoblaciones de tamaños kNNN ,...,, 21 , estas

divisiones son llamadas estratos. La estratificación se realiza porque si una población

heterogénea es dividida en estratos homogéneos dentro y heterogéneos entre, la

precisión del muestreo puede ser incrementada, en relación con el MAS.

Mendenhall et al. (1987) mencionan que los motivos para utilizar el muestreo aleatorio

estratificado en lugar del muestreo aleatorio simple son los siguientes:

• La estratificación puede producir un límite más pequeño para el error de

estimación que el que se generaría en una muestra aleatoria simple del mismo

tamaño, este resultado es particularmente cierto si las mediciones dentro de los

estratos son homogéneas.

• El costo por unidad de muestreo puede ser reducido mediante la estratificación

de los elementos de la población en grupos convenientes.

• Se pueden obtener estimaciones de parámetros poblacionales para subgrupos de

la población. Los subgrupos deben ser estratos identificables.

2.1.1. Estimación de la media poblacional.

Según Sukhatme P. y Sukhatme B. (1970), Ni denota el tamaño del estrato, es decir, el

número de unidades en el i-ésimo estrato, ni el tamaño de la muestra aleatoria simple a

seleccionar en el estrato i y k el número de estratos con:

ii =∑

donde N y n denotan el número total de unidades en la población y en la muestra

respectivamente. Por otra parte, si Y representa una característica de interés y ijy su

valor en la unidad j del estrato i, entonces la media poblacional Ny puede ser expresada

iiN ypyN

Ny ∑∑

1 ; 2.1

donde NN

p ii = es el “peso” o “ponderación” del estrato i, y

iNy es la media

poblacional para el i -ésimo estrato. Puesto que la muestra en cada estrato es una muestra

aleatoria simple, iny resulta ser un estimador insesgado de

iNy , por lo que es natural

considerar a:

iiw ypy ∑

como un estimador de la media poblacional, el cual es una media ponderada de las

medias de los estratos por los “pesos” de los estratos. Es fácil observar que el estimador

(2.2) resulta ser un estimador insesgado de la media poblacional expresada en (2.1),

dado que:

iniini

iiw yypyEpypEyE ===

= ∑∑∑=== 111

)()( 2.3

Ahora, si se considera que 2iS es el cuadrado medio (varianza) poblacional para el i -

ésimo estrato y que está dado por:

11 ∑

−−

NS i=1, 2, …,k 2.4

y que del MAS,

( ) 211i

−= i=1, 2, …,k 2.5

entonces la varianza del estimador de la media en el MAE es dada por la expresión (2.6)

2 11)()( ii

i iiniiw Sp

NnyVpyV ∑ ∑

−== 2.6

De acuerdo con el MAS, el cuadrado medio muestral del estrato i, denotado y expresado

11 ∑

−−

ns i=1, 2, …,k 2.7

es un estimador insesgado de 2iS . De este modo, se sigue que un estimador insesgado

para la varianza dada en (2.6) es:

11)(ˆii

i iw sp

NnyV ∑

−= 2.8

2.1.2. Tamaño de muestra a seleccionar en los diferentes estratos.

Rendón (1976) establece que en el muestreo estratificado pueden considerarse dos

etapas para el diseño de la muestra:

a) Definición de la muestra total para la población.

b) Definición de la muestra para cada estrato.

Esta última se conoce como asignación, descomposición o distribución de la muestra

total en los estratos.

Por otra parte, el tamaño de muestra a seleccionar en cada estrato estará en función,

principalmente, de los siguientes factores: el tamaño, la variabilidad y el costo por

estrato. Rendón (1976) menciona como importantes los siguientes tipos de asignación,

de acuerdo a los factores considerados.

Asignación Óptima. El tamaño de muestra de cada estrato se determina considerando el

tamaño, la variabilidad y el costo por estrato.

Asignación de Neyman. No se toma en cuenta o considera un costo constante para cada

estrato, por lo cual, el tamaño de muestra en cada estrato está en función del tamaño del

estrato y de su variabilidad. Debe mencionarse que la asignación de Neyman es también

una asignación óptima

Asignación Proporcional. En este caso se considera el costo y la variabilidad constantes

en cada estrato, entonces, las unidades a seleccionar en cada estrato serán proporcionales

al tamaño del mismo.

La forma funcional de la asignación Óptima y las correspondientes a las de Neyman y

Proporcional, éstas como casos particulares de la Óptima, se derivan de acuerdo con

Sukhatme (1962) de la forma siguiente:

De la ecuación (2.6) se observa que la varianza del estimador de la media poblacional

está en función del tamaño de muestra de los estratos ( in , i=1,2,…,k). Aun cuando estos

tamaños de muestra pueden fijarse arbitrariamente, es recomendable determinarlos

considerando la precisión de la estimación y el costo total del muestreo, cuando menos.

De este modo, su determinación se puede hacer según el criterio siguiente:

a) Seleccionar los in , i=1,2,…,k de tal manera que la varianza del estimador de la media

sea mínima bajo la restricción de un costo total del muestreo fijo.

o bien,

b) Seleccionar los in , i=1,2,…,k de tal manera que el costo total del muestreo sea

mínimo bajo la restricción de una varianza del estimador de la media fija.

Para aplicar este criterio se requiere disponer de una función del costo total del

muestreo, por ejemplo:

iii ncC

donde ci representa el costo promedio por unidad de muestreo en el i-ésimo estrato.

Así, para determinar el tamaño de muestra para cada estrato siguiendo el criterio (a) y

según las expresiones (2.6) y (2.9) se establece la ecuación Langrangiana:

−+= ∑

iiiwi CncyVn

10)( λϕ ∀ i=1,2,…,k 2.10

donde C0 representa el costo total del muestreo fijo.

Luego, al derivar (2.10) con respecto a ni para todo i=1,2,…,k e igualar a cero, se

obtiene la solución:

= 2.11

ecuación conocida como asignación Óptima.

Ahora, si se considera que ci = c ∀ i= 1, 2, …, k; es decir, que el costo promedio por

unidad es constante en los estratos, entonces (2.9) y (2.11) se transforman

respectivamente en:

cnC =0 , c

Cn 0= 2.12

, i=1,2,…,k 2.13

Nótese que según (2.12) el tamaño de muestra total resulta ser una cantidad fija o dada

de antemano, con lo cual los tamaños de muestra según (2.13) se pueden interpretar

como aquellas ni que minimizan la varianza del estimador de la media, bajo la

consideración de un tamaño de muestra fijo.

Este último resultado (2.13) fue encontrado primeramente por Tschuprow (1923; citado

por Sukhatme, 1962) pero permaneció desconocido hasta que, en forma independiente,

fue redescubierto por Neyman (1934; citado por Sukhatme, 1962). Por esta razón la

ecuación (2.13) es conocida como asignación de Neyman.

Una vez más, si en la asignación de Neyman se supone que Si = S para toda i=1,2,…,k;

entonces la ecuación (2.13) queda expresada como:

ii npn = , i=1,2,…,k 2.14

ecuación denominada asignación Proporcional.

Rendón (1998) indica que en la práctica tienen mayor aplicación las asignaciones de

Neyman y Proporcional, debido principalmente a que la Óptima presenta la dificultad de

disponer de una función única para el costo total del muestreo.

2.1.3. Funciones de varianza.

Como ya se mencionó, la varianza del estimador de la media poblacional en el MAE, la

cual está dada por la ecuación (2.6) y que se reproduce a continuación, es una función de

los ni, i=1,2,…,k.

11)( ii

i iiw Sp

NnyV ∑

−= 2.15

Por lo tanto, la forma que tome la ecuación (2.15) dependerá de la asignación particular

que se use. Así, cuando se aplica la asignación Óptima de la ecuación (2.11) que

considera la función del costo dada en la expresión (2.9) se obtendrá “la varianza del

estimador de la media bajo la asignación Óptima” en MAE, cuya forma es:

∑∑==

iiOw Sp

11)( 2.16

Si la asignación que se usa es la de Neyman de ecuación (2.13) entonces se tendrá “la

varianza del estimador de la media bajo asignación de Neyman”, esto es:

∑∑==

iiiNeyw Sp

11)( 2.17

Asimismo, sí es la Proporcional de ecuación (2.14) “la varianza del estimador de la

media bajo asignación Proporcional” será:

iiiPw Sp

211)( 2.18

Para el caso de estimadores insesgados la varianza del estimador es una de las medidas

de la precisión de la estimación. En particular, la diferencia entre las varianzas (2.18) y

(2.17) muestran lo siguiente:

( ) ( ) ( ) 011

2 ≥−=− ∑=

iiwiNeywPw pSS

nyVyV 2.19

donde ∑=

iiiw SpS

1 es la media ponderada de las desviaciones estándares de los

estratos.

De (2.19) es claro que:

( ) ( )PwNeyw yVyV ≤ o ( )( ) 1≤

Por lo tanto de (2.19) se puede concluir que: “para un tamaño de muestra total fijo o

dado (n) el MAE bajo la asignación de Neyman será más preciso que bajo asignación

proporcional, en la medida que exista mayor variabilidad entre los estratos”.

2.2. Dificultades prácticas para aplicar la asignación de Neyman.

Sukhatme P. y Sukhatme B. (1970) mencionan que la asignación de Neyman presenta

algunas dificultades prácticas para su uso, la más importante es el desconocimiento de la

desviación estándar de cada estrato (Si , i=1,2,…,k). No obstante, tal limitación puede

evitarse al estimar dichas desviaciones a partir de una muestra preliminar de tamaño n’.

Estas estimaciones, sin embargo estarán sujetas a error y, por lo tanto, puede ocurrir que

en estas condiciones el uso de la asignación de Neyman resulte menos eficiente que la

asignación proporcional (2.14).

2.2.1. Interrogantes planteadas en la principal dificultad.

La estimación de la desviación estándar de cada estrato (Si , i=1,2,…,k) para así aplicar

la asignación de Neyman conduce a plantear algunas interrogantes de interés. Como son:

a) ¿Cuánto aumentaría la varianza del estimador de la media bajo la asignación de

Neyman, en promedio, si la asignación se basa en los valores estimados de Si ,

i=1,2,…,k?

b) ¿Cómo se compara la “nueva varianza del estimador de la media bajo asignación de

Neyman”, con la varianza del estimador de la media bajo asignación

Proporcional?

c) ¿Qué tan grande debe ser el tamaño de muestra preliminar para que la asignación de

Neyman, al usar estimaciones de Si , i=1,2,…,k, resulte más eficiente que la

asignación Proporcional?

2.2.2. Solución a las interrogantes planteadas.

Para responder las interrogantes (a), (b) y (c), Sukhatme P. y Sukhatme B. (1970)

obtuvieron una aproximación del valor esperado de la “nueva varianza de Neyman”; es

decir, de la varianza del estimador de la media que resulta al estimar Si , i=1,2,…,k, en la

asignación de Neyman (2.13).

Sea 2is un estimador insesgado de 2

iS , obtenido con base en una muestra preliminar de

tamaño n’. De este modo, la asignación de la muestra total entre los estratos, al seguir el

método de Neyman, se realizará con la ecuación siguiente:

ˆ , i=1,2,…,k 2.21

Así, al sustituir (2.21) en la expresión (2.15) se obtiene la “nueva varianza de Neyman”

denotada y dada por:

( )kwNNw sssyVyv ,...,,|)( 21=

∑∑ ∑== =≠

ijjiii Sp

SppSpn 1

222 11 2.22

Nótese que (2.22) incluye los estimadores si de Si, i=1,2,…k, que variarán de muestra a

muestra, consecuentemente no se puede decir cuando se obtendrá un valor menor,

comparada con la varianza del estimador de la media bajo la asignación Proporcional

dada en (2.18).

Para dar una respuesta a las interrogantes planteadas en la sección 2.2.1, se obtendrá el

valor esperado (2.22) como sigue:

kiSs iii ,...2,1 ; 22 =+= ε 2.23

( ) 0=iE ε , ( ) ( )22ii SVE =ε ∀ i

( ) 0=jiE εε , ∀ i ≠ j 2.24

De este modo, el cociente

s involucrado en (2.22) puede ser expresado por:

2 11−

ss εε 2.25

Ahora, al expandir en serie de McLaurin el lado derecho de (2.25), multiplicar y omitir

las potencias de ε mayores de dos; después sustituir el resultado en (2.22), tomar la

esperanza considerando (2.24) y que c i = cj = C ∀ i ≠ j son los coeficientes de

variación 2is y 2

js dados por ( )2

sVc = .

Se tendrá

( )[ ] ∑∑ ∑== =≠

jijijiiiNNw Sp

NCSSppSp

( ) ∑=≠

jijijiNeyw SSpp

Al suponer que la característica o variable de interés tiene una distribución normal;

entonces para muestras preliminares de tamaño n’, el coeficiente de variación al

cuadrado (c2) será igual a '/2 n . De acuerdo con esto, (2.26) queda como:

( )[ ] ( ) ∑=≠

jijijiNeywNNw SSpp

nnyVyvE

+= ∑∑

iiiNeyw SpSp

Las expresiones (2.26) y (2.27) responden a la interrogante (a); esto es, cuánto se

incrementa, en promedio, la varianza de Neyman por usar estimadores de las

desviaciones estándares en la asignación de Neyman.

La respuesta a la interrogante (b) se obtiene al expresar (2.27) en términos de la varianza

Proporcional; esto se logra al considerar la ecuación (2.19), con lo cual se tendrá que:

( )[ ] ( ) ( )

+−−≅ ∑∑∑

iiwiPwNNw SpSp

nyVyvE

´211 2.28

La expresión (2.28) tendrá un valor más pequeño, comparado con la varianza del

estimador de la media bajo asignación Proporcional, si la suma de los dos últimos

términos del lado derecho es negativa. Luego entonces, una condición para que la

asignación de Neyman al estimar Si, i=1,2,…, k, no conduzca, en promedio, a una

pérdida de precisión comparada con la asignación Proporcional es que:

( )∑ ∑∑= ==

+−−

iiiiwi SpSp

es decir,

( )∑∑∑===

−≤

iii pSSSpSp

De (2.29) se puede dar una respuesta a la interrogante (c), estableciendo un límite

inferior para el tamaño de muestra preliminar n’; con el cual la asignación de Neyman,

al usar estimadores de Si, puede dar, en promedio, una estimación más precisa que la

Proporcional. Así, de (2.29)

( )∑

∑∑

2' 2.30

De este último resultado (2.30) se puede concluir que mientras mayor sea la variabilidad

entre las Si, menor será el tamaño de muestra preliminar n’. Consecuentemente, a menos

que las desviaciones estándares de los estratos sean muy similares, muestras

preliminares moderadamente pequeñas darán, en promedio, resultados más precisos que

la asignación Proporcional.

Por otro lado, también Sukhatme (1935; citado por Sukhatme, 1962) abordó el problema

tomando en cuenta la interrogante: ¿cuál es la probabilidad de que la “nueva varianza de

Neyman” sea menor que la varianza obtenida con la asignación Proporcional? Para dar

respuesta a la interrogante, obtuvo una aproximación de la Función de Distribución de la

“nueva varianza de Neyman”. El asumió que la distribución de la característica en

estudio era aproximadamente normal y simplificó “la nueva varianza de Neyman”

eliminando el factor de corrección por finitud. Para obtener la función de distribución,

determinó los cuatro primeros momentos de la “nueva varianza de Neyman” y con ellos

encontró la Curva de Pearson más apropiada que aproxima a la distribución. Después de

probar dicha aproximación concluyó que, en muchos casos, el método propuesto resulta

mejor que el uso de la asignación Proporcional.

Dado que las soluciones anteriores para dar respuesta al problema son aproximadas y

que en algunos casos son difíciles de obtener, como lo es la interrogante de probabilidad

donde es necesario calcular cuando menos los tres primeros momentos de la nueva

varianza de Neyman y que además tienen una expresión larga y complicada; Rendón y

Carrillo (1976) consideraron conveniente estudiar el problema desde otro punto de vista,

en forma concreta abordaron dos aspectos:

i. Encontrar aquella expresión que proporcione la probabilidad de que la “nueva varianza

de Neyman” sea menor que la varianza Proporcional, mediante la deducción

exacta de la Función de Distribución de dicha varianza de Neyman.

ii. Con base en el punto anterior y en una muestra preliminar, cuyo tamaño dependerá de

la disposición económica para el estudio, establecer una condición que permita

determinar una primera aproximación del tamaño de muestra definitivo que

garantice que la asignación de Neyman será más eficiente que la Proporcional.

Debido a las dificultades que presenta el punto (i), Rendón y Carrillo (1976) obtuvieron

la solución sólo para el caso de dos estratos que, aun cuando restringida, tiene áreas de

aplicación. Para tal efecto, asumieron que la característica de interés se distribuye

normal. De este modo encontraron que la función de distribución exacta de la “nueva

varianza de Neyman” está dada como sigue:

( ) ( ) ( )[ ] ( ) ( ) dtttyVyvPpFx

rrPwNNwV

∫ −−Β

=<=−2

1 2.31

donde ( )NNwyv y ( )PwyV son las expresadas respectivamente por las ecuaciones (2.22)

y (2.18), 212

1 SrSrSrx+

= , 222

2 SrSrSrx+

= , 1,2i 1 =∀−= ii nr

Del análisis de (2.31) obtuvieron conclusiones como las siguientes:

a) Para muestra pequeñas, n: ri = ni -1 para toda i=1,2 (o grandes) mientras mayor sea

la diferencia entre 21S y 2

2S , la asignación de Neyman al usar estimadores de Si, i

= 1,2 , será más eficiente que la proporcional con una probabilidad que tiende a

la unidad. Este resultado es similar al que proporciona la ecuación (2.30) dada

por Sukhatme (1970).

b) Si la distancia o “abertura” de x1 y x2 (similitud con la diferencia de 21S y 2

permanece constante y se hacen variar a r1 = n1 -1 y r2 = n2 -1 (n=n1+n2) los

cuales pueden ser del mismo valor o diferentes, entonces existen valores r1 y r2

que proporcionan un valor de probabilidad próximo a la unidad.

c) Al tomar en cuenta el inciso (b) establecieron una condición que permite determinar

una primera aproximación al tamaño de muestra total definitivo y su distribución

en los estratos, de tal manera que se garantice con cierta probabilidad que la

asignación de Neyman (con la estimación de Si, i=1,2) será mejor que la

Proporcional.

Tal condición fue establecida como sigue:

( ) ( ) ( ) α−≥−Β

= ∫ −−

dtttpFx

1 ˆˆˆ

srsrsrx+

= , 222

2 ˆˆˆ

srsrsrx+

1,2i y ˆ 2 =∀ii sr : estimadores de ri y 2iS obtenidos con base en una muestra

preliminar de tamaño n’.

α > 0.

La condición (2.32) indica que si se calculan los límites '1x y '

2x , usando los estimadores

ir̂ y 2is de una muestra preliminar, es posible fijar un valor de probabilidad para la

expresión (2.31) en la vecindad de uno. De esta forma se estará en la condición de

seleccionar aquel miembro de la familia Beta que mediante sus valores r1 y r2 asegure

que la probabilidad de que la “nueva varianza de Neyman” sea menor que la varianza

Proporcional quede comprendida en dicha vecindad. Estos últimos valores r1 y r2

determinan una primera aproximación del tamaño de muestra a seleccionar en los

estratos 1 y 2, a través de ni = ri -1 para toda i=1,2. El tamaño de muestra total en la

primera aproximación queda definido por n=n1+n2.

III. METODOLOGÍA

3.1. Población.

Para lograr los objetivos del trabajo se generaron aleatoriamente 12 poblaciones, cada

una de tamaño N = 1000 unidades, tres de ellas miembros de la familia Normal, tres de

la familia Gama, tres de la familia Ji-cuadrada y , finalmente, tres de la familia Poisson.

Las doce poblaciones se dividieron en tres estratos con los siguientes tamaños: 1N =200,

2N =300, 3N =500. Para obtener los estratos, la población se ordenó de menor a mayor y

en el primer estrato se ubicaron las 200 unidades de menor magnitud, en el segundo

estrato se ubicaron las 300 unidades, y por último se ubicaron las 500 unidades de mayor

magnitud.

En el Cuadro 1 se presentan las distribuciones y sus parámetros a partir de las cuales se

generaron las 12 poblaciones utilizadas, las distribuciones son continuas, con excepción

de la distribución Poisson, pero dada la magnitud del parámetro λ, esta distribución se

comporta como una distribución continua.

Para responder al objetivo (a), con los datos de cada una de las poblaciones, divididas en

estratos, se procedió al cálculo de las varianzas y desviaciones estándares para cada

estrato. Con esta información censal se realizó el cálculo de las varianzas del estimador

de la media bajo el método de asignación de Neyman, y bajo el método de asignación

Proporcional, según las ecuaciones (2.17) y (2.18), respectivamente.

Cuadro 1. Distribuciones y sus parámetros a partir de las cuales se generaron las doce poblaciones utilizadas.

No. Distribución Parámetros 1 Normal µ=100, σ = 25 2 Normal µ=100, σ = 50 3 Normal µ=100, σ = 75 4 Gamma α=5 5 Gamma α=10 6 Gamma α=20 7 Poisson λ = 200 8 Poisson λ = 250 9 Poisson λ = 300 10 Ji-cuadrada ν = 100 11 Ji-cuadrada ν = 150 12 Ji-cuadrada ν = 200

3.2. Muestreo.

Para trabajar los objetivos (b) y (c), en cada una de las poblaciones estratificadas se

consideraron tres tamaños de muestra totales fijos (TMTF): 0n = 50, 0n = 100, 0n =150,

estos tamaños fueron determinados de manera tal que representen el 5, 10 y 15 % de la

población. Para estimar la desviación estándar de cada estrato, y de esta manera

distribuir el TMTF entre los estratos, para cada uno de los TMTF se decidió usar

tamaños de muestra preliminares (TMP) diferentes, los cuales se distribuyeron en forma

proporcional al tamaño de los estratos, lo cual se ilustra en el Cuadro 2 para la población

normal µ=100 y σ=25. Se procedió de la misma forma para las once poblaciones

restantes.

Cuadro 2. Distribución de la muestra preliminar en los diferentes estratos, según la

población con media de 100 y desviación estándar de 25. Unidades asignadas al estrato TMTF TMP

E 1 E 2 E 3 =′n 13 1n′ = 3 2n′ = 4 3n′ = 6 =′n 20 1n′ = 4 2n′ = 6 3n′ = 10

=0n 50

=′n 26 1n′ = 5 2n′ = 8 3n′ = 13 =′n 13 1n′ = 3 2n′ = 4 3n′ = 6 =′n 20 1n′ = 4 2n′ = 6 3n′ = 10

=0n 100

=′n 30 1n′ = 6 2n′ = 9 3n′ = 15 =′n 16 1n′ = 3 2n′ = 5 3n′ = 8 =′n 30 1n′ = 6 2n′ = 9 3n′ = 15

=0n 150

=′n 46 1n′ = 9 2n′ = 14 3n′ = 23

Una vez que los tamaños de muestra preliminar fueron asignados a los estratos en forma

proporcional, se procedió a realizar el MAE, este muestreo se repitió 40 veces, y a partir

de las observaciones obtenidas se estimaron 40 desviaciones estándares para cada

estrato, en cada población. Por ejemplo:

=0n 50 =′n 13 jn1′ = 3: 1401211 ,...,, sss ′′′

jn2′ = 4: 2402221 ,...,, sss ′′′

jn3′ = 6: 3403231 ,...,, sss ′′′

Posteriormente, con la información de desviaciones estándares estimadas, peso de los

estratos y TMTF, se procedió a calcular la distribución del TMTF entre los estratos,

según el método de asignación de Neyman y en este caso particular se utilizó la

ecuación:

0ˆ i =1,2, 3 j = 1, 2, …, 40 3.1

en donde:

0n : Tamaño de muestra total fijo (50, 100, 150)

ijn̂ : Tamaño de muestra correspondiente a la j-ésima repetición en el i-ésimo estrato.

ip : Proporción de unidades del estrato i-ésimo con respecto a la población total (“peso”

del estrato i).

ijs : Desviación estándar de la j-iésima repetición del i-ésimo estrato obtenida a partir de

la muestra preliminar ijn′ .

Para cada una de las 40 repeticiones mencionadas se calculó la denominada nueva

varianza de Neyman, obteniéndose el promedio de estas 40 varianzas, como sigue:

== jNNw

yv 3.2

en donde jNNwyv )( se obtuvo con la expresión siguiente, que es equivalente a la (2.22)

∑ ∑= =

=−=k

iiNNjw ,..., ,jSp

4021 1ˆ

)( 3.3

donde 40,...,2,1 ;3,2,1 ;ˆ == jinij está dada según (3.1).

3.3. Análisis

El análisis de la información obtenida se realizó, principalmente, con el uso del

indicador denominado “eficiencia del diseño de muestreo (deff)”, la estructura de este

indicador es dada por un cociente de varianzas cuyo numerador es la varianza del

método que se desea comparar y el denominador es la varianza del método con que se

compara (Esquivel, 2003), esto es:

( ) ( )( )θθ

θ ˆˆ

aasp v

vdeff = 3.4

( )( )( ) comparara. se que elcon estimador del Varianza : ˆ

comparar. a método elcon estimador del Varianza : ˆmuestral. diseño del eficiencia la deIndicador :ˆ

:dondeen

Se considera que un método es más eficiente que otro, si la varianza del estimador

obtenida a través de este método es menor que la obtenida por el otro método. De esta

manera si el deff es mayor que 1, se considera que el método utilizado en el

denominador es más eficiente; si el deff es igual a 1, se considera que los dos métodos

tienen la misma eficiencia; y si el deff es menor que 1, se considera que el método

utilizado en el numerador es más eficiente.

De acuerdo con la expresión (3.4) y los objetivos del estudio, el indicador de la

eficiencia del diseño quedó de la siguiente manera:

a) Para comparar de forma censal el método de asignación de Neyman con el

Proporcional se calcularon los indicadores dados como:

NeywPNey yVar

yVdeff

=− NeywPwNeyP yVyVDif )()( −=− 3.5

En donde NeywyVar )( y PwyVar )( se obtuvieron, respectivamente, según (2.17) y (2.18).

b). En la comparación del método de asignación de Neyman; bajo la estimación de Si,

i=1,2,...,k, con la forma paramétrica se usaron como indicadores a:

NNwNeyNN yVar

yvdeff

=− NeywNNwNeyNN yVyvDif )()( −=− 3.6

En donde NNwyv )( y NeywyVar )( se obtuvieron, respectivamente, con las expresiones

(3.2) y (2.17).

c) En el caso de la comparación del método de asignación de Neyman, bajo la

estimación de Si, i=1,2,...,k, con la forma paramétrica de la asignación Proporcional se

emplearon como estimadores de los indicadores a:

NNwPNN yVar

yvdeff

=− PwNNwPNN yVyvDif )()( −=− 3.7

En donde NNwyv )( y PwyVar )( se obtuvieron, respectivamente, según (3.2) y (2.18).

3.4. Programación

La simulación para generar las poblaciones bajo las 12 diferentes distribuciones, la

división de estas poblaciones en estratos, la realización del muestreo preliminar, la

obtención de las desviaciones estándares estimadas y la asignación del tamaño de

muestra total fijo en los estratos, fue realizada mediante comandos básicos de

programación, en la ventana file-script del paquete estadístico S-PLUS 2000.

Los cálculos de las varianzas paramétricas de los métodos de asignación de Neyman y

proporcional y los promedios de las varianzas estimadas de la media del método de

asignación de Neyman, fueron realizados con el apoyo de la hoja de cálculo de Excel de

Office 2000.

IV. RESULTADOS Y DISCUSIÓN

En este capítulo se presentan en primer lugar los programas generados con el paquete

estadístico S-PLUS 2000 y, a continuación, de acuerdo con las cuatro distribuciones

consideradas y el orden en que se plantearon los objetivos de estudio, se exponen y

discuten brevemente los resultados obtenidos.

4.1 Programas generados

Con el propósito de cumplir con los objetivos planteados, se generaron doce programas

con el paquete estadístico S-PLUS 2000, un programa para cada una de las doce

distribuciones, a partir de las cuales, a su vez, se generaron las poblaciones definidas en

el Cuadro 1; tres miembros de la familia Normal, tres de la Ji-cuadrada, tres de la Gama

y tres de la Poisson.

En el Anexo 1 se describen brevemente los comandos correspondientes al programa

utilizado en la distribución Normal con media igual a 100 y desviación estándar igual a

25. En el Anexo 2 se presentan las modificaciones y comandos utilizados en los

programas de las once distribuciones restantes.

4.2. Distribución Normal.

Para el caso de las poblaciones cuyas distribuciones son miembros de la familia Normal,

el Cuadro 3 muestra los resultados que son pertinentes al primer objetivo (a) de estudio.

Dicho cuadro presenta cantidades a nivel censal o paramétricas como son: la desviación

estándar de cada población, las desviaciones estándares de los estratos, las varianzas del

estimador de la media según los métodos de asignación de Neyman y Proporcional;

asimismo, los indicadores correspondientes a la eficiencia del diseño.

Cuadro 3. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones normales bajo estudio.

Desv. Están. 1S 2S 3S (1) TMTF

NeywyV )( PwyV )( deffNey-P DifP-Ney

50 2.4207 2.6545 0.91190 0.23 100 1.1405 1.2574 0.90701 0.12

25 9.79 6.88 14.58 11.71

150 0.7137 0.7917 0.90154 0.08 50 10.3179 11.4862 0.89829 1.17 100 4.8567 5.4408 0.89264 0.58

50 20.64 13.20 30.56 58.37

150 3.0363 3.4257 0.88632 0.39 50 23.2301 25.7591 0.90182 2.53 100 10.9372 12.2017 0.89637 1.26

75 33.14 19.37 45.24 126.41

150 6.8396 7.6825 0.89027 0.84 (1) Variabilidad entre desviaciones estándares de los estratos, calculada según la ecuación (2.19) sin el

factor (1/n)

En el mismo Cuadro 3, se observa que, en cada población, las desviaciones estándares

de los estratos son menores que la desviación estándar de la población, esto indica que

efectivamente se ha realizado un bloqueo de la variación. Asimismo, las desviaciones

estándares son diferentes de estrato a estrato; este hecho, junto con los tamaños de los

estratos diferentes, es suficiente para decir que el MAE bajo asignación de Neyman dará

estimaciones más precisas que con la asignación proporcional (Rendón, 1998). Lo

anterior se corrobora al notar que, en cada población, la varianza del estimador es menor

cuando se aplica la asignación de Neyman que cuando se usa la Proporcional,

independientemente del TMTF ( 0n ); aun cuando la diferencia de estas varianzas tiende a

ser menor, en valor absoluto, al incrementarse el TMTF; pero en términos relativos,

como lo muestra el deffNey-P calculado según (3.5), al incrementar el TMTF el valor de

este índice tiende a ser cada vez menor que la unidad. Esto último se puede apreciar

objetivamente en las Figuras 1, 2 y 3.

En esta parte es conveniente mencionar la simbología que se usa en general para todas

las figuras que se presentan. En el eje de las ordenadas los niveles del TMTF están

representados por: “A” el nivel bajo ( 0n =50), “B” el nivel medio ( 0n =100) y “C” el

nivel alto ( 0n =150). Cada uno de los niveles del TMTF están acompañados por los

niveles correspondientes al TMP, esto es, para el nivel “A” se tendrán; “a” como nivel

bajo (n’ =13) del TMP, “b” nivel medio (n’ =20) y “c” nivel alto (n’ =26); para el nivel

“B”, el nivel bajo “a” (n’ =13), el nivel medio “b” (n’ =20) y el nivel alto “c” (n’ =30);

para el nivel “C” del TMTF se tendrá, nivel bajo “a” (n’ =16), nivel medio “b” (n’ =30)

y nivel alto “c” (n’ = 46) para el TMP.

Por otra parte, en el Cuadro 3, también se aprecia que la variabilidad entre las

desviaciones estándares de los estratos es diferente de población a población; se observa

que el valor más pequeño de dicha variabilidad se presenta en la población con

desviación estándar de 25 y el valor mayor en la población con desviación estándar 75.

Ahora bien, si se pone atención en cualquier TMTF, por ejemplo 0n =50, se puede notar

que, tanto la varianza del estimador de la media bajo asignación de Neyman como la

correspondiente bajo la asignación Proporcional, se incrementan de una población a otra

y lo mismo ocurre con las diferencias entre tales varianzas (DifP-Ney). Este hecho

demuestra, numéricamente en términos absolutos, la conclusión que se deriva de la

ecuación (2.19); es decir, para un TMTF, el MAE bajo la asignación de Neyman será

más preciso que bajo la asignación Proporcional, en la medida que exista mayor

variabilidad entre los estratos.

En cuanto al objetivo (b), el Cuadro 4 muestra el comportamiento numérico de la “nueva

varianza de Neyman”, al considerar su promedio en 40 repeticiones ( NNwyv )( ), con

relación a la varianza paramétrica ( NeywyV )( ), la variabilidad de las poblaciones, los

TMTF y los TMP, considerados en el estudio, así como el indicador de la eficiencia del

diseño de muestreo.

Como era de esperarse, tanto en el Cuadro 4 como en las Figuras 1, 2 y 3, se observa

que, en cada una de las tres poblaciones normales, el valor del índice deffNN-Ney

(calculado según la expresión 3.6) es mayor de uno, lo cual indica que la varianza del

estimador de la media bajo asignación de Neyman resulta menor que el promedio de las

“nuevas varianzas de Neyman”; esto mismo se deduce al observar las diferencias entre

el promedio de las nuevas varianzas y la varianza del estimador bajo asignación de

Neyman, diferencia que resulta positiva y que concuerda, obviamente, con lo que

expresa la ecuación (2.27).

Cuadro 4. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones normales.

DESV EST

TMTF TMP NNwyv )( NeywyV )( deffNN-Ney DifNN-Ney

13 2.7577 2.4207 1.13922 0.3370 20 2.7565 2.4207 1.13874 0.3358

26 2.5347 2.4207 1.04712 0.1141 13 1.2894 1.1405 1.13056 0.1489 20 1.2003 1.1405 1.05250 0.0599

30 1.1817 1.1405 1.03613 0.0412 16 0.9169 0.7137 1.28466 0.2032 30 0.7513 0.7137 1.05257 0.0375

46 0.7300 0.7137 1.02276 0.0162 13 12.6786 10.3179 1.22880 2.3607 20 11.7200 10.3179 1.13590 1.4022

26 11.3056 10.3179 1.09573 0.9877 13 6.7919 4.8567 1.39846 1.9352 20 5.7794 4.8567 1.19000 0.9228

30 5.5311 4.8567 1.13887 0.6744 16 4.0620 3.0363 1.33782 1.0257 30 3.6182 3.0363 1.19165 0.5819

46 3.5911 3.0363 1.18275 0.5549 13 28.6010 23.2301 1.23120 5.3709 20 26.6937 23.2301 1.14910 3.4636

26 25.6955 23.2301 1.10613 2.4654 13 14.1748 10.9372 1.29602 3.2376 20 12.9707 10.9372 1.18593 2.0335

30 12.6715 10.9372 1.15857 1.7343 16 8.8739 6.8396 1.29744 2.0344 30 8.4539 6.8396 1.23603 1.6143

46 8.2743 6.8396 1.20977 1.4347

Ahora, también en el Cuadro 4 y las Figuras 1, 2 y 3, se observa en las tres poblaciones

que, al incrementar el TMTF ( 0n ) y dentro de estos incrementar a su vez el TMP (n’), el

valor del deffNN-Ney tiende al valor 1, aunque esto ocurre con mayor rapidez en las

poblaciones más homogéneas. Tal tendencia se aprecia en TMP que son moderadamente

pequeños en relación con el tamaño de la población; desde luego que en poblaciones

más heterogéneas se requieren TMP mayores, para que el deffNN-Ney esté próximo a la

unidad. Este mismo resultado se observa, también, con las diferencias entre el promedio

de la “nueva varianza de Neyman” y la varianza del estimador bajo asignación de

Neyman (DifNN-Ney), diferencias que tienden al valor cero; lo que indica mayor

semejanza entre ambas varianzas, lo anterior corrobora nuevamente lo que expresa la

ecuación (2.27).

Cuadro 5. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones normales bajo estudio.

DESV EST

TMTF TMP NNwyv )( PwyV )( deffNN-P DifNN-P

13 2.7577 2.6545 1.03886 0.1032 20 2.7565 2.6545 1.03842 0.1020

26 2.5347 2.6545 0.95487 -0.1198 13 1.2894 1.2574 1.02543 0.0320 20 1.2003 1.2574 0.95463 -0.0571

30 1.1817 1.2574 0.93978 -0.0757 16 0.9169 0.7917 1.15817 0.1252 30 0.7513 0.7917 0.94893 -0.0404

46 0.7300 0.7917 0.92206 -0.0617 13 12.6786 11.4862 1.10381 1.1924 20 11.7200 11.4862 1.02036 0.2339

26 11.3056 11.4862 0.98428 -0.1806 13 6.7919 5.4408 1.24831 1.3510 20 5.7794 5.4408 1.06224 0.3386

30 5.5311 5.4408 1.01659 0.0903 16 4.0620 3.4257 1.18573 0.6363 30 3.6182 3.4257 1.05619 0.1925

46 3.5911 3.4257 1.04829 0.1654 13 28.6010 25.7591 1.11033 2.8419 20 26.6937 25.7591 1.03628 0.9346

26 25.6955 25.7591 0.99753 -0.0636 13 14.1748 12.2017 1.16171 1.9732 20 12.9707 12.2017 1.06303 0.7690

30 12.6715 12.2017 1.03851 0.4699 16 8.8739 7.6825 1.15508 1.1914 30 8.4539 7.6825 1.10040 0.7713

46 8.2743 7.6825 1.07702 0.5917

En el Cuadro 5 se presentan los resultados que tienen relación con el objetivo (c) y

muestran el comportamiento del promedio de las “nuevas varianzas de Neyman” con la

varianza del estimador bajo la asignación Proporcional, según las poblaciones normales

consideradas. Asimismo, de forma objetiva, en las Figuras 1, 2 y 3 se observa dicho

comportamiento de acuerdo con el índice deffNN-P.

Según el Cuadro 5 y las figuras mencionadas se observa que, en las tres poblaciones,

para cada TMTF ( 0n ) al incrementar el TMP (n’), el indicador deffNN-P tiende a tomar

valores menores que uno o muy cercanos a uno. El valor del deffNN-P menor que uno se

aprecia principalmente en las poblaciones más homogéneas. Por otra parte, estas

tendencias se notan para TMP que son relativamente pequeños, en relación con el

tamaño de la población. Tales resultados también se muestran con las diferencias entre

el promedio de las “nuevas varianzas de Neyman” y las varianzas del estimador bajo

asignación Proporcional (DifNN-P), en este caso, las diferencias tienden a tomar valores

negativos o cercanos a cero.

Aa Ab Ac Ba Bb Bc Ca Cb Cc

deff NN-Ndeff NN-Pdeff N-P

Figura 1. Índices de la eficiencia del diseño de muestreo considerando el promedio de

las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 25.

odeff NN-Ndeff NN-Pdeff N-P

Figura 2. Índices de la eficiencia del diseño de muestreo considerando el promedio de las

varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 50.

las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población normal con media igual a 100 y desviación estándar igual a 75.

De lo anterior se deduce que, para TMP moderadamente pequeños y en poblaciones

normales no muy heterogéneas, la asignación de Neyman bajo la estimación de las

desviaciones estándares de los estratos dará, en promedio, estimaciones más precisas que

la asignación Proporcional. Como se puede notar, para el caso de poblaciones más

heterogéneas, se requerirán TMP ligeramente mayores a los considerados en el presente

estudio, quizás muestras preliminares mayores al 5 % con relación al tamaño de la

población. Es claro que en las poblaciones más heterogéneas deberá pensarse en el

número de estratos en que será dividida la población.

Por otra parte, es necesario mencionar que los resultados obtenido, al menos para el caso

normal, no concuerdan con las conclusiones que se derivan de la ecuación (2.30), donde

se dice que mientras mayor sea la variabilidad entre las desviaciones estándares de los

estratos, menor será el TMP (n’) para que, en promedio, la asignación de Neyman dé

estimaciones más precisas que la asignación Proporcional (los cálculos de la variabilidad

entre estratos, a partir de la ecuación 2.30, para todas las poblaciones se presenta en el

Anexo 3). En este estudio la mayor variabilidad entre las desviaciones estándares de los

estratos se obtiene en aquellas poblaciones que son más heterogéneas, como es la

población con una desviación estándar de 75 y, como ya se dijo, en este caso se

requieren TMP ligeramente mayores a las consideradas para que la asignación de

Neyman dé, en promedio, estimaciones más precisas que la asignación Proporcional.

Nuevamente, deberá pensarse si existe alguna relación al construir más estratos en

poblaciones con mayor heterogeneidad.

4.3. Distribución Ji-cuadrada.

Ahora, para el caso de las poblaciones cuyas distribuciones pertenecen a la familia Ji-

cuadrada, el Cuadro 6 muestra resultados relacionados con el primer objetivo de estudio

(a). En este cuadro se observa a nivel censal o paramétrico los grados de libertad de la

población, la desviación estándar de cada población, las desviaciones estándares de los

estratos, las varianzas del estimador de la media según los métodos de asignación de

Neyman y Proporcional; asimismo, los indicadores correspondientes a la eficiencia del

diseño.

En el Cuadro 6 se observa también que, las desviaciones estándares dentro de los

estratos son menores a la desviación estándar de la población, lo cual indica que

efectivamente se ha realizado un bloqueo a la variación. Las desviaciones estándares son

diferentes de estrato a estrato y los tamaños de los estratos son diferentes, por lo que se

puede suponer que las estimaciones bajo asignación de Neyman serán más eficientes que

las estimaciones bajo asignación Proporcional, lo cual coincide con lo señalado por

Rendón (1998). Lo anterior se puede corroborar al observar que, en cada población, la

varianza del estimador es menor cuando se utiliza la asignación de Neyman que cuando

se utiliza la asignación Proporcional, este comportamiento es independiente del TMTF

(n0). Se observa también que la diferencia entre las varianzas del estimador tiende a ser

menor al incrementarse el TMTF, sin embargo al realizar la comparación en términos

relativos a través del deffNey-P, se aprecia que el índice tiende a ser cada vez menor que la

unidad. Lo anterior puede corroborarse en las Figuras 4, 5 y 6.

Cuadro 6. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio.

GL Desv Est 1S 2S 3S (1) TMT

F NeywyV )(

PwyV )( deffNey-P DifP-Ney

50 0.89585 1.05558 0.84868 0.160 100 0.42014 0.50001 0.84027 0.080

100 14.14 5.79 3.17 9.57 7.99

150 0.26158 0.31482 0.83088 0.053 50 1.35636 1.58563 0.85541 0.229

100 0.63645 0.75109 0.84738 0.115 150 17.32 7.09 4.05 11.70 11.47

150 0.39648 0.47291 0.83840 0.076 50 1.69158 1.98342 0.85286 0.292

100 0.79360 0.93952 0.84469 0.146 200 20 7.52 4.64 13.16 14.59

factor (1/n) Según el Cuadro 6 la variabilidad entre las desviaciones estándares de los estratos es

diferente de población a población; se observa que el valor más bajo de esta variabilidad

se presenta en la población con 100 grados de libertad, y el valor más alto se presenta en

la población con 200 grados de libertad. En el mismo cuadro, para cualquier TMTF, se

nota que las varianzas del estimador se incrementan cuando aumentan los grados de

libertad de la población, lo mismo sucede con las diferencias entre estas varianzas (DifP-

Ney). Lo anterior, en términos absolutos, corrobora numéricamente la conclusión que se

deriva de la ecuación (2.19); es decir, para un TMTF dado, el MAE bajo la asignación

de Neyman será más preciso que bajo la asignación Proporcional, en la medida que

exista mayor variabilidad entre los estratos.

Para abordar el objetivo (b), el Cuadro 7 muestra, en poblaciones Ji-cuadrada, los grados

de libertad de las poblaciones, los TMTF y los TMP considerados en el estudio, el

promedio de las “nuevas varianzas”, la varianza paramétrica de Neyman, así como el

indicador de la eficiencia del diseño y la diferencia entre las dos varianzas consideradas.

Cuadro 7. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio.

GL TMTF TMP NNwyv )( NeywyV )( deffNN-Ney DifNN-Ney

13 1.06276 0.89585 1.18632 0.167 20 0.99345 0.89585 1.10895 0.098

26 0.96356 0.89585 1.07559 0.068 13 0.48751 0.42014 1.16035 0.067 20 0.45097 0.42014 1.07337 0.031

30 0.44268 0.42014 1.05363 0.023 16 0.29358 0.26158 1.12235 0.032 30 0.27299 0.26158 1.04362 0.011

46 0.27036 0.26158 1.03358 0.009 13 1.70085 1.35636 1.25398 0.344 20 1.50889 1.35636 1.11246 0.153

26 1.44965 1.35636 1.06877 0.093 13 0.81754 0.63645 1.28453 0.181 20 0.71138 0.63645 1.11773 0.075

30 0.69853 0.63645 1.09754 0.062 16 0.51027 0.39648 1.28699 0.114 30 0.44723 0.39648 1.12798 0.051

46 0.43487 0.39648 1.09681 0.038 13 2.26488 1.69158 1.33891 0.573 20 1.84822 1.69158 1.09260 0.157

26 1.84785 1.69158 1.09238 0.156 13 0.96525 0.79360 1.21630 0.172 20 0.89694 0.79360 1.13022 0.103

30 0.88326 0.79360 1.11298 0.090 16 0.61668 0.49427 1.24766 0.122 30 0.56328 0.49427 1.13962 0.069

46 0.55193 0.49427 1.11667 0.058

Tanto en el Cuadro 7 como en las Figuras 4, 5 y 6 se observa que, en cada una de las tres

poblaciones Ji-cuadrada, el valor del índice deffNN-Ney es mayor que la unidad, lo cual

indica que la varianza paramétrica del estimador de la media bajo asignación de Neyman

resulta menor que el promedio de las “nuevas varianzas de Neyman”; se deduce lo

mismo al observar las diferencias entre el promedio de las “nuevas varianzas” y la

varianza del estimador bajo asignación de Neyman, la diferencia siempre es mayor a

cero, y concuerda, obviamente, con lo que expresa la ecuación (2.27).

Ahora, en el mismo Cuadro 7 y en las Figuras 4, 5 y 6, se observa en las tres poblaciones

que, para cada TMTF al incrementar el TMP, el valor del deffNN-Ney tiende al valor uno,

esto ocurre más rápidamente en las poblaciones más homogéneas. Tal tendencia se

aprecia en TMP que son moderadamente pequeños en relación con el tamaño de la

población, es obvio que, en poblaciones más heterogéneas se requieren TMP mayores,

para que el deffNN-Ney esté próximo a la unidad. Se observa el mismo comportamiento al

considerar las diferencias entre el promedio de las “nuevas varianzas de Neyman” y las

varianzas del estimador bajo asignación de Neyman (DifNN-Ney), ya que las diferencias

siempre son positivas y tienden a acercarse a cero cuando se incrementa el TMP, lo que

indica mayor similitud entre ambas varianzas

En el Cuadro 8 se presentan los resultados que tienen relación con el objetivo (c) y

varianza del estimador bajo la asignación Proporcional, según las poblaciones Ji-

cuadrada consideradas.

Según el Cuadro 8 y las Figuras 4, 5 y 6 en las tres poblaciones Ji-cuadrada, para cada

TMTF al incrementar TMP, el indicador deffNN-P tiende a tomar valores menores que

uno. Se observa que, en general, el valor del indicador deffNN-P es menor en poblaciones

más homogéneas. Tales resultados también se muestran con las diferencias entre el

promedio de las “nuevas varianzas de Neyman” y las varianzas del estimador bajo

asignación proporcional (DifNN-P), en este caso las diferencias tienden a tomar valores

menores a cero.

Con base en lo anterior se deduce que con TMP moderadamente pequeños y en

poblaciones Ji-cuadrada, la asignación de Neyman bajo la estimación de las

desviaciones estándares de los estratos proporciona, en promedio, estimaciones más

precisas que la asignación proporcional, cuando se incrementa el TMP. Aunque, esto

ocurre en las tres poblaciones Ji-cuadrada, el resultado es más evidente en poblaciones

más heterogéneas.

Cuadro 8. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Ji-cuadrada bajo estudio.

GL TMTF TMP NNwyv )( PwyV )( deffNN-P DifNN-P

13 1.06276 1.05558 1.00680 0.007 20 0.99345 1.05558 0.94114 -0.062

26 0.96356 1.05558 0.91283 -0.092 13 0.48751 0.50001 0.97501 -0.012 20 0.45097 0.50001 0.90192 -0.049

30 0.44268 0.50001 0.88533 -0.057 16 0.29358 0.31482 0.93253 -0.021 30 0.27299 0.31482 0.86712 -0.042

46 0.27036 0.31482 0.85878 -0.044 13 1.70085 1.58563 1.07267 0.115 20 1.50889 1.58563 0.95161 -0.077

26 1.44965 1.58563 0.91424 -0.136 13 0.81754 0.75109 1.08848 0.066 20 0.71138 0.75109 0.94714 -0.040

30 0.69853 0.75109 0.93003 -0.053 16 0.51027 0.47291 1.07901 0.037 30 0.44723 0.47291 0.94570 -0.026

46 0.43487 0.47291 0.91956 -0.038 13 2.26488 1.98342 1.14190 0.281 20 1.84822 1.98342 0.93184 -0.135

26 1.84785 1.98342 0.93165 -0.136 13 0.96525 0.93952 1.02739 0.026 20 0.89694 0.93952 0.95468 -0.043

30 0.88326 0.93952 0.94012 -0.056 16 0.61668 0.59155 1.04249 0.025 30 0.56328 0.59155 0.95221 -0.028

46 0.55193 0.59155 0.93304 -0.040

Parece ser que los resultados obtenidos no concuerdan con las conclusiones que se

derivan de la ecuación (2.30), ecuación obtenida bajo el supuesto de población Normal;

donde se dice que mientras mayor sea la variabilidad entre las desviaciones estándares

de los estratos, menor será el TMP requerido para que, en promedio, la asignación de

Neyman proporcione estimaciones más precisas que la asignación Proporcional. Al

incrementar la varianza de la población, se incrementa la varianza entre los estratos y

también se aumenta la varianza dentro de los estratos, hecho que influye sobre el TMP

requerido. Puede pensarse que al incrementar la varianza de la población, debe también

incrementarse el número de estratos a considerar.

varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Ji-cuadrada con 100 grados de libertad.

4.4. Distribución Gama.

A continuación, para el caso de las poblaciones cuyas distribuciones pertenecen a la

familia Gama, el Cuadro 9 muestra los resultados relacionados con el primer objetivo de

estudio (a). Se muestra a nivel censal el valor del parámetro α, la desviación estándar de

cada población, las desviaciones estándares de los estratos, las varianzas del estimador

de la media según los métodos de asignación de Neyman y Proporcional; asimismo, se

presentan los indicadores correspondientes a la eficiencia del diseño de muestreo.

Se observa también, en el Cuadro 9, que las desviaciones estándares de los estratos son

menores a la desviación estándar de la población, lo cual indica que el bloqueo de la

variación a través de la estratificación fue efectivo. Se nota, además, que las

desviaciones estándares de los estratos son diferentes y los tamaños de los estratos

también son diferentes, esto permite suponer que la asignación de Neyman presentará

estimaciones más eficientes que la asignación Proporcional. Lo anterior se corrobora al

observar que, en todas las poblaciones, la varianza del estimador de la media obtenida

con el método de asignación de Neyman es menor a la obtenida con el método de

asignación Proporcional, este comportamiento es independiente del TMTF (n0). En el

Cuadro y también en las Figuras 7, 8 y 9 se observa que el deffNey-P en todos los casos es

menor que uno y tiende a disminuir cuando se incrementa el TMTF; se observa además

que, el indicador antes mencionado presenta valores menores en las poblaciones menos

heterogéneas. En cuanto a la diferencia entre las varianzas del estimador obtenidas con

los métodos de asignación de Neyman y Proporcional (DifP-Ney), se observa que en todos

los casos es mayor a cero y tiende a disminuir cuando se incrementa el TMTF.

Cuadro 9. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio.

α Desv Est 1S 2S 3S (1) TMTF

NeywyV )(

PwyV )( deffNey-P DifP-Ney

50 0.02735 0.03743 0.7306800 0.010 100 0.01269 0.01773 0.7157178 0.005

5 2.24 0.54 0.47 1.92 0.50

150 0.00780 0.01116 0.6989953 0.003 50 0.04582 0.05751 0.7967216 0.012 100 0.02140 0.02724 0.7854284 0.006

10 3.16 1.05 0.65 2.31 0.58

150 0.01325 0.01715 0.7728065 0.004 50 0.08962 0.10888 0.8231602 0.019 100 0.04195 0.05157 0.8133358 0.010

20 4.47 1.61 0.97 3.14 0.96

factor (1/n)

Según el Cuadro 9 la variabilidad entre las desviaciones estándares de los estratos es

diferente de población a población; se observa que el valor más bajo de esta variabilidad

se presenta en la población cuyo parámetro α es de 5 unidades, y el valor más alto de

esta variabilidad se presenta en la población con parámetro a igual a 20. Para cualquier

TMTF se nota, en el mismo cuadro, que las varianzas del estimador se incrementan

cuando aumenta el valor del parámetro α, lo mismo sucede entre las diferencias entre

estas varianzas (DifP-Ney). Lo anterior coincide, en términos absolutos, con la conclusión

que se deriva de la ecuación (2.19); es decir, para un TMTF dado, el método de

asignación de Neyman proporcionará estimaciones más precisas que el método de

asignación Proporcional a medida que exista mayor variabilidad entre los estratos.

En el caso del objetivo (b), el Cuadro 10 muestra, en poblaciones Gama, los valores del

parámetro α, los TMTF y los TMP considerados en el estudio, el promedio de las

“nuevas varianzas de Neyman”, la varianza paramétrica de Neyman, así como indicador

de la eficiencia del diseño de muestreo (deffNN-Ney) y la diferencia entre las dos varianzas

consideradas (DifNN-Ney).

Cuadro 10. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio.

α TMTF TMP NNwyv )( NeywyV )( deffNN-Ney DifNN-Ney

13 0.03313 0.02735 1.21123164 0.006 20 0.02888 0.02735 1.05602179 0.002

26 0.02829 0.02735 1.03448588 0.001 13 0.01479 0.01269 1.16559267 0.002 20 0.01356 0.01269 1.06850051 0.001

30 0.01322 0.01269 1.04157812 0.001 16 0.00863 0.00780 1.10629454 0.001 30 0.00806 0.00780 1.03247418 0.000

46 0.00797 0.00780 1.02161902 0.000 13 0.05245 0.04582 1.14475586 0.007 20 0.04943 0.04582 1.0787485 0.004

26 0.04898 0.04582 1.06901724 0.003 13 0.02603 0.02140 1.21643407 0.005 20 0.02393 0.02140 1.11852884 0.003

30 0.02342 0.02140 1.09474655 0.002 16 0.01750 0.01325 1.32043895 0.004 30 0.01495 0.01325 1.12760023 0.002

46 0.01450 0.01325 1.09382886 0.001 13 0.11242 0.08962 1.25440586 0.023 20 0.10309 0.08962 1.15027308 0.013

26 0.09740 0.08962 1.08680067 0.008 13 0.05243 0.04195 1.24991359 0.010 20 0.04737 0.04195 1.1293665 0.005

30 0.04663 0.04195 1.11168798 0.005 16 0.03314 0.02605 1.27199181 0.007 30 0.03082 0.02605 1.18303636 0.005

46 0.03037 0.02605 1.16571416 0.004

Tanto en el Cuadro 10 como en las Figuras 7, 8 y 9 se observa que, en las tres

poblaciones Gama consideradas, el valor del indicador deffNN-Ney es mayor a la unidad, lo

cual indica que la varianza del estimador de la media bajo asignación de Neyman es

menor que el promedio de las “nuevas varianzas de Neyman”; se obtiene la misma

deducción al observar las diferencias entre estas varianzas, puesto que estas son siempre

mayores a cero, lo anterior concuerda con lo que expresa la ecuación (2.27).

Se observa en el mismo Cuadro 10 y en las Figuras 7, 8 y 9 que, para cada TMTF al

incrementar el TMP, el valor del deffNN-Ney tiende a tomar el valor de la unidad, esto

ocurre más rápidamente en las poblaciones más homogéneas. Es obvio que en

poblaciones más heterogéneas se requieren TMP mayores, para acercarse a la unidad. Al

considerar las diferencias entre las varianzas antes mencionadas (DifNN-Ney), se observa el

mismo comportamiento, ya que estas diferencias son siempre mayores a cero y tienden a

acercarse a cero cuando se incrementa el TMP. Lo que es indicativo de mayor similitud

entre dichas varianzas.

Los resultados que tienen relación con el objetivo (c) se presentan en el Cuadro 11, y

varianza del estimador bajo la asignación Proporcional, según las poblaciones Gama

consideradas.

Cuadro 11. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Gama bajo estudio.

α TMTF TMP NNwyv )( PwyV )( deffNN-P DifNN-P

13 0.03313 0.03743 0.88502 -0.004 20 0.02888 0.03743 0.77161 -0.009

26 0.02829 0.03743 0.75587 -0.009 13 0.01479 0.01773 0.83423 -0.003 20 0.01356 0.01773 0.76474 -0.004

30 0.01322 0.01773 0.74547 -0.005 16 0.00863 0.01116 0.77329 -0.003 30 0.00806 0.01116 0.72169 -0.003

46 0.00797 0.01116 0.71410 -0.003 13 0.05245 0.05751 0.91205 -0.005 20 0.04943 0.05751 0.85946 -0.008

26 0.04898 0.05751 0.85170 -0.009 13 0.02603 0.02724 0.95542 -0.001 20 0.02393 0.02724 0.87852 -0.003

30 0.02342 0.02724 0.85984 -0.004 16 0.01750 0.01715 1.02044 0.000 30 0.01495 0.01715 0.87141 -0.002

46 0.01450 0.01715 0.84531 -0.003 13 0.11242 0.10888 1.03257 0.004 20 0.10309 0.10888 0.94685 -0.006

26 0.09740 0.10888 0.89461 -0.011 13 0.05243 0.05157 1.01659 0.001 20 0.04737 0.05157 0.91855 -0.004

30 0.04663 0.05157 0.90417 -0.005 16 0.03314 0.03247 1.02058 0.001 30 0.03082 0.03247 0.94921 -0.002

46 0.03037 0.03247 0.93531 -0.002

Según el Cuadro 11 y las Figuras 7, 8 y 9, en las tres poblaciones Gama, para cada

TMTF al incrementar el TMP, el indicador deffNN-P tiende a disminuir, se observa que

este indicador es menor en las poblaciones menos heterogéneas. La misma tendencia se

observa con la diferencia entre el promedio de las “nuevas varianzas de Neyman” y la

varianza del estimador obtenida a través del método de asignación Proporcional (DifNN-

P), ya que en la población más homogénea todas las diferencias son menores a cero, cosa

que no sucede, en todos los casos, en las otras dos poblaciones con mayor variabilidad.

varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Gama con parámetro α igual a 5.

Con base en lo anterior se deduce que, con TMP moderadamente pequeños y en

poblaciones Gama, la asignación de Neyman bajo la estimación de las desviaciones

estándares de los estratos proporciona, en promedio, estimaciones más precisas del

estimador de la media que la asignación proporcional.

Al igual que en las poblaciones normales, parece ser que los resultados obtenidos no

concuerdan con las conclusiones que se derivan de la ecuación (2.30), ecuación derivada

para poblaciones normales, donde se dice que mientras mayor sea la variabilidad entre

las desviaciones estándares de los estratos, menor será el TMP requerido para que, en

promedio la asignación de Neyman proporcione estimaciones más precisas que la

asignación Proporcional. Sin embargo, también en las poblaciones Gama, al incrementar

la varianza de la población, se incrementó la varianza entre los estratos y, se aumentó la

varianza dentro de los estratos, hecho que influye sobre el TMP requerido.

4.5. Distribución Poisson.

Ahora, el Cuadro 12 muestra los resultados pertinentes al primer objetivo de este estudio

(a), obtenidos en poblaciones con distribución Poisson; los resultados mostrados son la

desviación estándar de la población, las desviaciones estándares de loes estratos, las

variaciones entre los estratos, las varianzas censales del estimador de la media bajo las

asignaciones de Neyman y Proporcional, los indicadores de la eficiencia del diseño de

muestreo que compara las varianzas anteriores y las diferencias entre estas varianzas.

En el Cuadro 12 se muestra que las desviaciones estándares dentro de los estratos son

menores que la desviación estándar de la población, lo anterior indica que la

estratificación contribuyó a realizar un bloqueo sobre la variación. Se observa que las

desviaciones estándares son diferentes de estrato a estrato; asimismo los tamaños de los

estratos también son diferentes, por lo que se supone que el método de asignación de

Neyman bajo estimaciones de las desviaciones estándares de los estratos proporcionará

estimaciones más precisas del estimador de la media que el método de asignación

proporcional, lo anterior coincide con lo señalado por Rendón (1998).

Se observa que, en todos los casos, el indicador deffNey-P siempre es menor a uno, lo cual

indica que la varianza del estimador es menor cuando se utiliza el método de asignación

de Neyman, que cuando se utiliza la asignación Proporcional, este comportamiento se

muestra independiente del TMTF. Lo anterior se corrobora al observar las diferencias

entre estas varianzas (DifP-Ney), ya que estas diferencias siempre son mayores a cero. Se

nota, además, que al incrementar el TMTF el método de asignación de Neyman tiende a

proporcionar estimaciones más eficientes que el método de asignación Proporcional. Lo

anterior puede corroborarse en las Figuras 10, 11 y 12.

Cuadro 12. Resultados pertinentes al objetivo (a), desviaciones estándares, tamaños de muestra total fijos, varianzas de estimadores e indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio.

λ Desv Est 1S 2S 3S (1) TMTF

NeywyV )(

PwyV )( deffNey-P DiffP-Ney

50 0.78559 0.90463 0.8684 0.119 100 0.36899 0.42851 0.8611 0.060

200 14.14 5.60 3.20 8.75 5.95

150 0.23012 0.26980 0.8529 0.040 50 0.97584 1.11874 0.8722 0.143

100 0.45848 0.52993 0.8651 0.071 250 15.81 6.30 3.61 9.70 7.15

150 0.28602 0.33366 0.8572 0.048 50 1.20066 1.35101 0.8887 0.150

100 0.56478 0.63995 0.8825 0.075 300 17.32 7.88 4.04 10.37 7.52

150 0.35281 0.40293 0.8756 0.050 (1) Variabilidad entre desviaciones estándares de los estratos, calculada según de la ecuación (2.19) sin el

factor (1/n)

Según el Cuadro 12 la variabilidad entre las desviaciones estándares de los estratos es

diferente de población a población; se observa que la variación entre los estratos más

baja se observa en la población con parámetro λ igual a 200, y el valor más alto de esta

variabilidad se presenta en la población con parámetro λ igual a 300. En el mismo

cuadro se aprecia que la varianza del estimador se incrementa, en ambos casos, cuando

aumenta la variación entre los estratos, lo mismo sucede con las diferencias entre las

varianzas (DiffP-Ney). Lo anterior coincide, en términos absolutos, con la conclusión que

se deriva de la ecuación (2.19); es decir, que el método de asignación de Neyman

proporcionará estimaciones más precisas que el método de asignación Proporcional a

medida que exista mayor variabilidad entre los estratos.

Para abordar el objetivo (b), el Cuadro 13 muestra, en poblaciones Poisson, el valor del

parámetro λ de las poblaciones, los TMTF y los TMP considerados en el estudio, el

promedio de las “nuevas varianzas”, la varianza paramétrica de Neyman, así como el

indicador de la eficiencia del diseño de muestreo y la diferencia entre las varianzas

consideradas.

Cuadro 13. Resultados con relación al objetivo (b), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio.

λ TMTF TMP NNwyv )( NeywyV )( deffNN-Ney DiffNN-Ney

13 0.89395 0.78559 1.13794 0.108 20 0.84711 0.78559 1.07831 0.062

26 0.82672 0.78559 1.05236 0.041 13 0.48652 0.36899 1.31853 0.118 20 0.40215 0.36899 1.08986 0.033

30 0.38541 0.36899 1.04450 0.016 16 0.27335 0.23012 1.18783 0.043 30 0.24071 0.23012 1.04602 0.011

46 0.23636 0.23012 1.02713 0.006 13 1.17372 0.97584 1.20278 0.198 20 1.06153 0.97584 1.08781 0.086

26 1.05449 0.97584 1.08060 0.079 13 0.55384 0.45848 1.20799 0.095 20 0.50776 0.45848 1.10750 0.049

30 0.50198 0.45848 1.09489 0.044 16 0.33165 0.28602 1.15953 0.046 30 0.31171 0.28602 1.08978 0.026

46 0.30736 0.28602 1.07458 0.021 13 1.38891 1.20066 1.15680 0.188 20 1.37943 1.20066 1.14889 0.179

26 1.29395 1.20066 1.07770 0.093 13 0.68767 0.56478 1.21760 0.123 20 0.66073 0.56478 1.16990 0.096

30 0.60713 0.56478 1.07500 0.042 16 0.41525 0.35281 1.17696 0.062 30 0.39308 0.35281 1.11413 0.040

46 0.39035 0.35281 1.10637 0.038

Tanto en el Cuadro 13 como en las Figuras 10, 11 y 12 se observa que, en las tres

poblaciones Poisson, el valor del índice deffNN-Ney es mayor que la unidad, lo anterior

indica que la varianza censal o paramétrica del estimador de la media bajo asignación de

Neyman es menor que el promedio de las “nuevas varianzas de Neyman”; se deduce lo

mismo al observar las diferencias entre las varianzas mencionadas (DifNN-Ney), ya que la

diferencia siempre es positiva, lo cual concuerda con la ecuación (2.27).

En el mismo Cuadro 13 y las Figuras 10, 11 y 12 se observa que, en las tres poblaciones

Poisson, para cada TMTF al incrementar el TMP, el valor del índice deffNN-Ney tiende al

valor uno; esto ocurre más rápidamente en las poblaciones más homogéneas. Es obvio

que en poblaciones más heterogéneas se requieren TMP mayores, para acercarse a la

unidad. Al considerar las diferencias entre las varianzas antes mencionadas (DifNN-Ney),

se observa el mismo comportamiento, ya que estas diferencias son siempre mayores a

cero y tienden a acercarse a cero cuando se incrementa el TMP, con lo cual habrá mayor

similitud entre ambas varianzas.

Cuadro 14. Resultados con relación al objetivo (c), tamaños de muestra total y preliminar, varianzas del estimador, indicadores de la eficiencia del diseño, según las poblaciones Poisson bajo estudio.

λ TMTF TMP NNwyv )( PwyV )( deffNN-P DifNN-P

13 0.89395 0.90463 0.98820 -0.011 20 0.84711 0.90463 0.93642 -0.058

26 0.82672 0.90463 0.91388 -0.078 13 0.48652 0.42851 1.13539 0.058 20 0.40215 0.42851 0.93848 -0.026

30 0.38541 0.42851 0.89943 -0.043 16 0.27335 0.26980 1.01314 0.004 30 0.24071 0.26980 0.89218 -0.029

46 0.23636 0.26980 0.87607 -0.033 13 1.17372 1.11874 1.04915 0.055 20 1.06153 1.11874 0.94886 -0.057

26 1.05449 1.11874 0.94257 -0.064 13 0.55384 0.52993 1.04512 0.024 20 0.50776 0.52993 0.95817 -0.022

30 0.50198 0.52993 0.94727 -0.028 16 0.33165 0.33366 0.99400 -0.002 30 0.31171 0.33366 0.93421 -0.022

46 0.30736 0.33366 0.92117 -0.026 13 1.38891 1.35101 1.02805 0.038 20 1.37943 1.35101 1.02103 0.028

26 1.29395 1.35101 0.95776 -0.057 13 0.68767 0.63995 1.07456 0.048 20 0.66073 0.63995 1.03246 0.021

30 0.60713 0.63995 0.94871 -0.033 16 0.41525 0.40293 1.03056 0.012 30 0.39308 0.40293 0.97555 -0.010

46 0.39035 0.40293 0.96876 -0.013

En el Cuadro 14 se presentan los resultados pertinentes al objetivo (c) y muestran el

comportamiento del promedio de las “nuevas varianzas de Neyman” con la varianza del

estimador bajo la asignación proporcional, según las poblaciones Poisson consideradas.

De acuerdo con el Cuadro 14 y las Figuras 10, 11 y 12, en las tres poblaciones Poisson,

para cada TMTF al incrementar el TMP, el indicador deffNN-P tiende a tomar valores

menores que uno. Se observa que, en general, el valor del deffNN-P es menor en

poblaciones menos heterogéneas. Estos resultados se confirman con las diferencias entre

las varianzas consideradas (DifNN-P), en este caso las diferencias tienden a tomar valores

menores a cero.

Con base en lo anterior se deduce que, en poblaciones Poisson, usando TMP

moderadamente pequeños, la asignación de Neyman bajo la estimación de las

desviaciones estándares de los estratos proporciona, en promedio, estimaciones más

precisas que la asignación Proporcional.

las varianzas estimadas de Neyman, la varianza paramétrica proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Poisson con parámetro λ igual a 200.

las varianzas estimadas de Neyman, la varianza proporcional y la varianza paramétrica de Neyman, obtenidos a partir de una población Poisson con parámetro λ igual a 200.

4.6. Consideraciones Generales.

Al considerar el caso del primer objetivo de estudio (a), se puede afirmar que; en las

poblaciones con distribuciones normales, Ji-cuadrada, Gama y Poisson, la varianza

censal del estimador de la media obtenido a través de la asignación de Neyman del MAE

es menor que la varianza censal del estimador obtenida mediante la asignación

Proporcional, independientemente del TMTF; es decir, la asignación de Neyman

proporciona estimaciones más precisas que la proporcional; hecho que puede

corroborarse al analizar el indicador deffNey-P, el cual siempre es mayor a la unidad. Los

mismos resultados se obtienen al analizar las diferencias entre las varianzas

anteriormente mencionadas, pues estas diferencias siempre son mayores a cero (DiffP-

Al abordar el objetivo (b), para poblaciones con distribuciones Normal, Ji-cuadrada,

Gama y Poisson, puede señalarse que la varianza censal del estimador de la media bajo

asignación de Neyman del MAE, en general es menor que el promedio de la “nueva

varianza de Neyman”, ya que el indicador deffNN-N es mayor que uno y, las diferencias

entre estas varianzas (DiffNN-P), son mayores a cero. Sin embargo se observa que, con

cualquier TMTF al incrementar el TMP, el indicador deffNN-N tiende a tomar valores

cercanos a la unidad y la diferencia entre las varianzas consideradas (DiffNN-P), tiende a

tomar valores cercanos a cero. De hecho, para TMP moderadamente pequeños en

relación con la población, la varianza censal del estimador de la media bajo asignación

de Neyman y el promedio de la “nueva varianza de Neyman” tienden a ser semejantes.

Esto es, con TMP moderadamente pequeños, en promedio, la asignación de Neyman,

bajo estimación de las Si, i=1,2,…,k, dará estimaciones con una precisión similar que la

de Neyman sin estimación de las Si.

En lo concerniente al objetivo (c), en general, para poblaciones con distribuciones

Normal, Ji-cuadrada, Gama y Poisson, puede decirse que la asignación de Neyman bajo

estimación de las desviaciones estándares de los estratos proporciona, en promedio,

estimadores de la media más precisos que los obtenidos a través de la asignación

Proporcional, cuando se incrementa el TMP. Esto puede observarse en los valores del

índice deffNN-P , los cuales tienden a tomar valores menores que uno cuando se

incrementa el TMP, este hecho también puede corroborarse a través de las diferencias

entre el promedio de las “nuevas varianzas de Neyman” y las varianzas del estimador

obtenidas con la asignación Proporcional (DiffNN-P), pues estas tienden a ser menores a

cero a medida que se aumenta el TMP. Además, debe mencionarse que lo anterior

ocurre, en general, para TMP moderadamente pequeños; sin embargo, en el caso

Normal, cuando la población es muy heterogénea, para lograr mejor precisión, en

promedio, que la asignación Proporcional, se requerirán TMP ligeramente mayores a los

usados en este estudio, o bien, incrementar el número de estratos.

Lo referente al objetivo (c) era de esperarse por los resultados obtenidos para el objetivo

(b); ya que el promedio de la “nueva varianza de Neyman” para TMP moderadamente

pequeños, tiende a ser igual a la varianza del estimador de la media bajo asignación de

Neyman sin estimación de las desviaciones estándares de los estratos, y de acuerdo con

la conclusión del objetivo (a), la asignación de Neyman es más eficiente que la

Proporcional. Resultados que son obtenidos independientemente de la distribución de la

población (Normal, Ji-cuadrada, Gama o Poisson), y el tamaño de muestra total fijo.

V. CONCLUSIONES

Según el análisis de los resultados, en cuanto a la eficiencia de las asignaciones de

Neyman y Proporcional en el Muestreo Aleatorio Estratificado, se derivan las siguientes

conclusiones de acuerdo con los objetivos planteados en el presente estudio:

• La asignación de Neyman es más eficiente que la Proporcional,

independientemente del tamaño de muestra total fijo y en poblaciones con

distribuciones Normal, Ji-cuadrada, Gama y Poisson. Esto es, la asignación de

Neyman proporciona estimaciones más precisas que la asignación Proporcional.

• Para poblaciones con distribuciones Normal, Ji-cuadrada, Gama y Poisson, la

varianza del estimador de la media bajo asignación de Neyman, en general, es

menor que el promedio de la “nueva varianza de Neyman”. Sin embargo, para

cualquier tamaño de muestra total fijo y tamaños preliminares moderadamente

pequeños, el promedio de la “nueva varianza de Neyman” tiende a ser semejante

a la varianza del estimador de la media bajo asignación de Neyman.

• En general, para las poblaciones con distribuciones Normal, Ji-cuadrada, Gama y

Poisson, la asignación de Neyman bajo estimación de las desviaciones estándares

de los estratos proporciona, en promedio, estimadores de la media más precisos

que los obtenidos a través de la asignación Proporcional, lo que ocurre con

tamaños de muestra preliminares moderadamente pequeños, en relación con la

población. Sin embargo, en el caso de poblaciones normales heterogéneas, para

lograr mejor precisión, en promedio, que la asignación Proporcional, se

requerirán tamaños de muestra preliminares ligeramente mayores a los usados en

este estudio, o bien, incrementar el número de estratos o modificar la

estratificación.

BIBLIOGRAFÍA

Cochran, W.G. (1977). Sampling Techniques. Jonh Wiley and Sons. Third Edition. New

York. USA. pp. 428.

Esquivel B., F. (2003). Algunas alternativas para estimar la matriz de covarianza en un

modelo de regresión lineal bajo un diseño de muestreo complejo. Tesis de

Doctorado. Colegio de Posgraduados. Motecillo, Texcoco. México. pp. 4-7.

Evans, W.D. (1951). “On Stratification and Optimum Allocations”, Journal of the

American Statistical Association, Vol. 46, pp. 95-104.

Mendenhall W., Ott, L. y Scheaffer, R.L. (1987). Elementos de Muestreo. Grupo

Editorial Iberoamérica. México DF. pp 78-112.

Rendón S., G. (1976). Una nota sobre la descomposición de Neyman en muestreo

estratificado. Tesis de Maestría. Escuela Nacional de Agricultura, Colegio de

Posgraduados. Chapingo, Méx.

Rendón S., G. (1998). Muestreo, aplicación en la estimación simultánea de varios

parámetros. Universidad Autónoma Chapingo. México.

Rendón S., G. y Carrillo L., A. (1976). Una nota sobre la descomposición de Neyman en

muestreo estratificado. Agrociencias. No. 26: 63-73

Sukhatme, P.V. (1962). Teoría de encuestas por muestreo con aplicaciones. Fondo de

Cultura Económica. México-Buenos Aires.

Sukhatme, P. V. and Sukhatme, B. V. (1970). Sampling theory of surveys with

applications. Iowa State University Press. Iowa. U.S.A.

ANEXO 1

Programa utilizado en la distribución Normal con µ=100 y σ=25 (Se utilizan tres puntos

para indicar que el procedimiento se continua con la misma secuencia).

# Obtención de la población a partir de la distribución normal con p<-rnorm(1000,100,25) # comando para ordenar las unidades de la población en forma ascendente ps<-sort(p) vps<-var(ps) vps # División de la población en tres estratos e1<-ps[1:200] e2<-ps[201:500] e3<-ps[501:1000] # Construcción de una matriz concentradora de las varianzas de cada estrato ve<-matrix(1,1,3) ve[1,1]<-var(e1) ve[1,2]<-var(e2) ve[1,3]<-var(e3) # GRUPO A # Asignación de tamaños de muestra preliminares de cada estrato At1<-3 At2<-4 At3<-6 # Asignación del tamaño de muestra total fijo Ant<-50 # Simulación de la toma de 40 muestras del estrato 1 Am11<-sample(e1,At1) Am12<-sample(e1,At1) Am13<-sample(e1,At1) . .

. Am140<-sample(e1,At1) # Obtención de las desviaciones estándares de las muestras del estrato 1 As11<-stdev(Am11) As12<-stdev(Am12) As13<-stdev(Am13) . . . As140<-stdev(Am140) # Simulación de la toma de 40 muestras del estrato 2 Am21<-sample(e2,At2) Am22<-sample(e2,At2) Am23<-sample(e2,At2) . . . Am240<-sample(e2,At2) # Obtención de las desviaciones estándares de las muestras del estrato 2 As21<-stdev(Am21) As22<-stdev(Am22) As23<-stdev(Am23) . . . As240<-stdev(Am240) # Simulación de la toma de 40 muestras del estrato 3 Am31<-sample(e3,At3) Am32<-sample(e3,At3) Am33<-sample(e3,At3) . . . Am340<-sample(e3,At3) # Obtención de las desviaciones estándares de las muestras del estrato 3 As31<-stdev(Am31) As32<-stdev(Am32) As33<-stdev(Am33) . . . As340<-stdev(Am340) # Tamaños de muestra estimados para el estrato 1 usando la asignación de neyman An11<-((Ant*0.2*As11)/(0.2*As11+0.3*As21+0.5*As31)) An12<-((Ant*0.2*As12)/(0.2*As12+0.3*As22+0.5*As32)) An13<-((Ant*0.2*As13)/(0.2*As13+0.3*As23+0.5*As33)) . . . An140<-((Ant*0.2*As140)/(0.2*As140+0.3*As240+0.5*As340))

# Tamaños de muestra estimados para el estrato 2 usando la asignación de neyman An21<-((Ant*0.3*As21)/(0.2*As11+0.3*As21+0.5*As31)) An22<-((Ant*0.3*As22)/(0.2*As12+0.3*As22+0.5*As32)) An23<-((Ant*0.3*As23)/(0.2*As13+0.3*As23+0.5*As33)) . . . An240<-((Ant*0.3*As240)/(0.2*As140+0.3*As240+0.5*As340)) # Tamaños de muestra estimados para el estrato 3 usando la asignación de neyman An31<-((Ant*0.5*As31)/(0.2*As11+0.3*As21+0.5*As31)) An32<-((Ant*0.5*As32)/(0.2*As12+0.3*As22+0.5*As32)) An33<-((Ant*0.5*As33)/(0.2*As13+0.3*As23+0.5*As33)) . . . An340<-((Ant*0.5*As340)/(0.2*As140+0.3*As240+0.5*As340)) # Matriz concentradora de los tamaños de muestra estimados de los diferentes

estratos Ame<-matrix(1,40,3) Ame[1,1]<-An11 Ame[2,1]<-An12 Ame[3,1]<-An13 . . . Ame[40,1]<-An140 Ame[1,2]<-An21 Ame[2,2]<-An22 Ame[3,2]<-An23 . . . Ame[40,2]<-An240 Ame[1,3]<-An31 Ame[2,3]<-An32 Ame[3,3]<-An33 . . . Ame[40,3]<-An340 #GRUPO B # Asignación de tamaños de muestra preliminares de cada estrato Bt1<-4 Bt2<-6 Bt3<-10 # Asignación del tamaño de muestra total fijo

Bnt<-50 # Simulación de la toma de 40 muestras del estrato 1 Bm11<-sample(e1,Bt1) Bm12<-sample(e1,Bt1) Bm13<-sample(e1,Bt1) . . . Bm140<-sample(e1,Bt1) # Obtención de las desviaciones estándares de las muestras del estrato 1 Bs11<-stdev(Bm11) Bs12<-stdev(Bm12) Bs13<-stdev(Bm13) . . . Bs140<-stdev(Bm140) # Simulación de la toma de 40 muestras del estrato 2 Bm21<-sample(e2,Bt2) Bm22<-sample(e2,Bt2) Bm23<-sample(e2,Bt2) . . . Bm240<-sample(e2,Bt2) # Obtención de las desviaciones estándares de las muestras del estrato 2 Bs21<-stdev(Bm21) Bs22<-stdev(Bm22) Bs23<-stdev(Bm23) . . . Bs240<-stdev(Bm240) # Simulación de la toma de 40 muestras del estrato 3 Bm31<-sample(e3,Bt3) Bm32<-sample(e3,Bt3) Bm33<-sample(e3,Bt3) . . . Bm340<-sample(e3,Bt3) # Obtención de las desviaciones estándares de las muestras del estrato 3 Bs31<-stdev(Bm31) Bs32<-stdev(Bm32) Bs33<-stdev(Bm33) . . . Bs340<-stdev(Bm340)

# Tamaños de muestra estimados para el estrato 1 usando la asignación de neyman Bn11<-((Bnt*0.2*Bs11)/(0.2*Bs11+0.3*Bs21+0.5*Bs31)) Bn12<-((Bnt*0.2*Bs12)/(0.2*Bs12+0.3*Bs22+0.5*Bs32)) Bn13<-((Bnt*0.2*Bs13)/(0.2*Bs13+0.3*Bs23+0.5*Bs33)) . . . Bn140<-((Bnt*0.2*Bs140)/(0.2*Bs140+0.3*Bs240+0.5*Bs340)) # Tamaños de muestra estimados para el estrato 2 usando la asignación de neyman Bn21<-((Bnt*0.3*Bs21)/(0.2*Bs11+0.3*Bs21+0.5*Bs31)) Bn22<-((Bnt*0.3*Bs22)/(0.2*Bs12+0.3*Bs22+0.5*Bs32)) Bn23<-((Bnt*0.3*Bs23)/(0.2*Bs13+0.3*Bs23+0.5*Bs33)) . . . Bn240<-((Bnt*0.3*Bs240)/(0.2*Bs140+0.3*Bs240+0.5*Bs340)) # Tamaños de muestra estimados para el estrato 3 usando la asignación de neyman Bn31<-((Bnt*0.5*Bs31)/(0.2*Bs11+0.3*Bs21+0.5*Bs31)) Bn32<-((Bnt*0.5*Bs32)/(0.2*Bs12+0.3*Bs22+0.5*Bs32)) Bn33<-((Bnt*0.5*Bs33)/(0.2*Bs13+0.3*Bs23+0.5*Bs33)) . . . Bn340<-((Bnt*0.5*Bs340)/(0.2*Bs140+0.3*Bs240+0.5*Bs340)) # Matriz concentradora de los tamaños de muestra estimados de los diferentes

estratos Bme<-matrix(1,40,3) Bme[1,1]<-Bn11 Bme[2,1]<-Bn12 Bme[3,1]<-Bn13 . . . Bme[40,1]<-Bn140 Bme[1,2]<-Bn21 Bme[2,2]<-Bn22 Bme[3,2]<-Bn23 . . . Bme[40,2]<-Bn240 Bme[1,3]<-Bn31 Bme[2,3]<-Bn32 Bme[3,3]<-Bn33 . . . Bme[40,3]<-Bn340

#GRUPO C . . . #GRUPO I # Asignación de tamaños de muestra preliminares de cada estrato It1<-9 It2<-14 It3<-23 # Asignación del tamaño de muestra total fijo Int<-150 # Simulación de la toma de 40 muestras del estrato 1 Im11<-sample(e1,It1) Im12<-sample(e1,It1) Im13<-sample(e1,It1) . . . Im140<-sample(e1,It1) # Obtención de las desviaciones estándares de las muestras del estrato 1 Is11<-stdev(Im11) Is12<-stdev(Im12) Is13<-stdev(Im13) . . . Is140<-stdev(Im140) # Simulación de la toma de 40 muestras del estrato 2 Im21<-sample(e2,It2) Im22<-sample(e2,It2) Im23<-sample(e2,It2) . . . Im240<-sample(e2,It2) # Obtención de las desviaciones estándares de las muestras del estrato 2 Is21<-stdev(Im21) Is22<-stdev(Im22) Is23<-stdev(Im23) . . . Is240<-stdev(Im240)

# Simulación de la toma de 40 muestras del estrato 3 Im31<-sample(e3,It3) Im32<-sample(e3,It3) Im33<-sample(e3,It3) . . . Im340<-sample(e3,It3) # Obtención de las desviaciones estándares de las muestras del estrato 3 Is31<-stdev(Im31) Is32<-stdev(Im32) Is33<-stdev(Im33) . . . Is340<-stdev(Im340) # Tamaños de muestra estimados para el estrato 1 usando la asignación de neyman In11<-((Int*0.2*Is11)/(0.2*Is11+0.3*Is21+0.5*Is31)) In12<-((Int*0.2*Is12)/(0.2*Is12+0.3*Is22+0.5*Is32)) In13<-((Int*0.2*Is13)/(0.2*Is13+0.3*Is23+0.5*Is33)) . . . In140<-((Int*0.2*Is140)/(0.2*Is140+0.3*Is240+0.5*Is340)) # Tamaños de muestra estimados para el estrato 2 usando la asignación de neyman In21<-((Int*0.3*Is21)/(0.2*Is11+0.3*Is21+0.5*Is31)) In22<-((Int*0.3*Is22)/(0.2*Is12+0.3*Is22+0.5*Is32)) In23<-((Int*0.3*Is23)/(0.2*Is13+0.3*Is23+0.5*Is33)) . . . In240<-((Int*0.3*Is240)/(0.2*Is140+0.3*Is240+0.5*Is340)) # Tamaños de muestra estimados para el estrato 3 usando la asignación de neyman In31<-((Int*0.5*Is31)/(0.2*Is11+0.3*Is21+0.5*Is31)) In32<-((Int*0.5*Is32)/(0.2*Is12+0.3*Is22+0.5*Is32)) In33<-((Int*0.5*Is33)/(0.2*Is13+0.3*Is23+0.5*Is33)) . . . In340<-((Int*0.5*Is340)/(0.2*Is140+0.3*Is240+0.5*Is340)) # Matriz concentradora de los tamaños de muestra estimados de los diferentes

estratos Ime<-matrix(1,40,3) Ime[1,1]<-In11 Ime[2,1]<-In12 Ime[3,1]<-In13 . . . Ime[40,1]<-In140

Ime[1,2]<-In21 Ime[2,2]<-In22 Ime[3,2]<-In23 . . . Ime[40,2]<-In240 Ime[1,3]<-In31 Ime[2,3]<-In32 Ime[3,3]<-In33 . . . Ime[40,3]<-In340

ANEXO 2

Para las demás distribuciones se realizaron las siguientes modificaciones en el comando de

determinación del tipo de distribución:

n<-rnorm(1000,100, 50) se utilizó para la distribución normal con una media de

100 y una desviación estándar de 50 unidades

n<-rnorm(1000,100, 75) se utilizó para la distribución normal con una media de

100 y una desviación estándar de 75 unidades

n<-rpois(1000,200) se utilizó para la distribución Poisson con parámetro λ

igual a 200

igual a 250

igual a 300

n<-rgamma(1000,5) se utilizó para la distribución Gama con parámetro α igual a

n<-rshisq(1000,100) se utilizó para la distribución Ji-cuadrada con 100 grados

de libertad.

n<- rshisq(1000,150) se utilizó para la distribución Ji-cuadrada con 150 grados

de libertad.

n<- rshisq(1000,200) se utilizó para la distribución Ji-cuadrada con 200 grados

de libertad.

Para asignar los diferentes tamaños de muestra preliminar se realizaron las siguientes

modificaciones:

Para un tamaño de muestra total fijo de 50 unidades

Para un tamaño de muestra preliminar de 13 unidades de muestreo t1<-3 t2<-4 t3<-6 Para un tamaño de muestra preliminar de 20 unidades de muestreo t1<-4 t2<-6 t3<-10

Para un tamaño de muestra preliminar de 26 unidades de muestreo t1<-5 t2<-8 t3<-13

Para un tamaño de muestra preliminar de 13 unidades de muestreo t1<-3 t2<-4 t3<-6 Para un tamaño de muestra preliminar de 20 unidades de muestreo t1<-4 t2<-6 t3<-10

Para asignar los diferentes tamaños de muestra definitivos se realizaron las siguientes

modificaciones:

nt<-50, para un tamaño de muestral total de 50 unidades nt<-100, para un tamaño de muestral total de 100 unidades nt<-150, para un tamaño de muestral total de 150 unidades

ANEXO 3

Cálculo de la variabilidad de las desviaciones estándares estimadas de los estratos en las

diferentes poblaciones.

DISTRIBUCIÓN NORMAL µ=100 σ=25 pi Si piSi 0.2 9.76 1.952 0.3 6.88 2.064 0.5 14.58 7.29

Smedia 11.306

pi Si Smedia (Si-Smedia) (Si-Smedia)2 pi(Si-Smedia)2 0.2 9.76 11.306 -1.546 2.390116 0.4780232 0.3 6.88 11.306 -4.426 19.589476 5.8768428 0.5 14.58 11.306 3.274 10.719076 5.359538

Variabilidad entre estratos 11.714404

Smedia 23.368

Smedia 35.059

DISTRIBUCIÓN JI-CUADRADA 100 G.L.

pi Si piSi 0.2 5.7869 1.15738 0.3 3.1751 0.95253 0.5 9.5744 4.7872

Smedia 6.89711

DISTRIBUCIÓN JI-CUADRADA 150 G.L. pi Si piSi 0.2 7.0865 1.4173 0.3 4.0527 1.21581 0.5 11.703 5.8515

Smedia 8.48461

DISTRIBUCIÓN JI-CUADRADA 200 G.L. pi Si piSi 0.2 7.5182 1.50364 0.3 4.6363 1.39089 0.5 13.163 6.5815

Smedia 9.47603

DISTRIBUCIÓN GAMA α=5 pi Si piSi 0.2 0.5402 0.10804 0.3 0.4752 0.14256 0.5 1.9204 0.9602

Smedia 1.2108

DISTRIBUCIÓN GAMA α=10

pi Si piSi 0.2 1.0456 0.20912 0.3 0.6536 0.19608 0.5 2.3142 1.1571

Smedia 1.5623

DISTRIBUCIÓN GAMA α=20 pi Si piSi 0.2 1.613 0.3226 0.3 0.9711 0.29133 0.5 3.1391 1.56955

Smedia 2.18348

DISTRIBUCIÓN POISSON λ=200 pi Si piSi 0.2 5.604 1.1208 0.3 3.2 0.96 0.5 8.748 4.374

Smedia 6.4548

Smedia 7.193

Smedia 7.9743

EFICIENCIA DE LOS MÉTODOS DE ASIGNACIÓN DE … · AGRADECIMIENTOS A la Secretaría de Educación...

Documents

Transcript of EFICIENCIA DE LOS MÉTODOS DE ASIGNACIÓN DE … · AGRADECIMIENTOS A la Secretaría de Educación...

El efecto de las herramientas tecnológicas en la educación

Tendencias tecnológicas y supuestos pedagógicos en la educación Superior en América Latina

Las actividades científicas y tecnológicas educativas en la Educación Especial

AGRADECIMIENTOS Equipo de Educación Infantil del Colegio ...

JV Exp 3 - Aplicaciones Tecnológicas en la Educación y sus Tendencias

Perspectivas tecnológicas: educación superior en ...openaccess.uoc.edu/.../10609/17021/6/horizon_iberoamerica_2012_ES… · Perspectivas tecnológicas: educación superior en Iberoamérica

Perspectivas Tecnológicas Educación Superior en América Latina 2013-2018 . NMC

Proyecto de herramientas tecnológicas para el aprendizaje en Educación Física.

Transformaciones científico tecnológicas y educación

CAPACITACIÓN EN HERRAMIENTAS TECNOLÓGICAS DE … · ii congreso internacional virtual sobre la educación en el siglo xxi (marzo 2017) capacitaciÓn en herramientas tecnolÓgicas

Agradecimientos - Internacional de la Educación · Agradecimientos: Este estudio se ha realizado con el apoyo de la Internacional de la Educación en el marco de la Campaña de Respuesta

Presentación de PowerPoint - · PDF fileEstrategias tecnológicas de los niveles neolíticos de los Abrigos de Abadsan y de Aougni N’Ourigh (Alto Atlas, Marruecos) AGRADECIMIENTOS

Harramientas tecnológicas para la educación

Las herramientas tecnológicas en la educación

Herramientas y aplicaciones tecnológicas aplicadas a la educación

Herramientas tecnológicas en educación

HERRAMIENTAS TECNOLÓGICAS PARA LA EDUCACIÓN

Las actividades científicas y tecnológicas educativas …cmapspublic2.ihmc.us/rid=1NYCMC56V-115T0DG-1J6... · Las actividades científicas y tecnológicas educativas en la Educación

Innovaciones tecnológicas en la educación temprana: reflexiones … · 2017-04-27 · Innovaciones tecnológicas en la educación temprana: reflexiones necesarias hacia la construcción

Herramientas tecnológicas aplicadas a la educación ...virtualeduca.red/documentos/23/Herramientas tecnológicas aplicadas... · de educar en línea. ... se cuenta con aulas virtuales