Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la...

86
Pr´ acticas de Muestreo en Poblaciones Finitas sobre datos de la Comunidad Aut´onoma Andaluza Manuel Mart´ ınez Blanes Francisco Rold´ an Orozco Francisco Javier Rond´ an Catalu˜ na Directores Mar´ ıa Mercedes Garc´ ıa Blanco Dpto. Did´ actica de las Ciencias Universidad de Sevilla Jos´ e Antonio Mayor Gallego Dpto. de Estad´ ıstica e Investigaci´ on Operativa Universidad de Sevilla

Transcript of Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la...

Page 1: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Practicas de Muestreo en Poblaciones Finitas sobredatos de la Comunidad Autonoma Andaluza

Manuel Martınez BlanesFrancisco Roldan Orozco

Francisco Javier Rondan Cataluna

Directores

Marıa Mercedes Garcıa BlancoDpto. Didactica de las Ciencias

Universidad de Sevilla

Jose Antonio Mayor GallegoDpto. de Estadıstica e Investigacion Operativa

Universidad de Sevilla

Page 2: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Indice general

Introduccion 1

1. Censos y muestreos. Obtencion de muestras 5

1.1. Muestreo de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2. Algoritmo MAS de aceptacion y rechazo . . . . . . . . . . . . . . . . 10

1.3. Algoritmo FMR de exploracion secuencial . . . . . . . . . . . . . . . 11

1.4. Muestreo sistematico . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2. Estadısticos, estimadores y su distribucion 16

3. Disenos uniformes y no uniformes. Muestreo aleatorio simple “ver-sus” muestreo con probabilidades variables 22

4. ¿Como estimar razones? 29

5. Informacion auxiliar en la estimacion: estimadores de razon y regre-sion 34

6. El muestreo estratificado 42

7. El muestreo por conglomerados 50

8. La funcion de dispersion sobre una poblacion finita 59

Apendice A. Datos de la poblacion DCA757 63

i

Page 3: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ii

Apendice B. Utilizacion de los programas descritos y de las bases dedatos 79

Referencias 82

Page 4: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Introduccion

Con este trabajo pretendemos ilustrar diversos aspectos del Muestreo en Pobla-ciones Finitas, mediante el empleo de practicas, que podrıamos calificar propiamentecomo experimentales, basadas fundamentalmente en la simulacion por computado-ra de las dos fases principales con las cuales esta disciplina se enfrenta al estudio dela realidad, esto es,

El muestreo o recoleccion de datos muestrales.

Y la estimacion o procesamiento de los mismos para estimar parametros po-blacionales y realizar inferencia sobre los mismos.

Estas simulaciones tienen como soporte de informacion, datos reales que mas ade-lante describiremos, pertenecientes a diversos ambitos de la Comunidad AutonomaAndaluza, como son el economico, el demografico o el sociologico.

Los objetivos que nos hemos propuesto con el diseno de estas practicas son varios:

1. Crear un soporte de actividades de apoyo a los cursos de Muestreo en Pobla-ciones Finitas que se imparten en diferentes niveles educativos y en distintascarreras como Matematicas, y Estadıstica, y tambien a los temas de esta ma-teria que suelen aparecer en las distintas asignaturas de Estadıstica en carrerascomo Informatica, Ciencias Biologicas, Ciencias de la Salud o Ciencias de laEconomıa y la Empresa.

2. Promocionar la utilizacion de datos reales y cercanos a nuestro ambiente comoson los pertenecientes a la Comunidad Autonoma a la que pertenecemos, lo queconstituye un vehıculo para fomentar el desarrollo de la Estadıstica en la misma,empezando por el ambito educativo, que tanta influencia tiene en la sociedad.

3. Ilustrar de una forma agil y realista las tecnicas de Muestreo en PoblacionesFinitas, de manera que los resultados que se obtengan se puedan contrastar conlos reales permitiendo ası verificar la potencia de dichas tecnicas.

1

Page 5: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INTRODUCCION 2

4. Poner a disposicion de la comunidad cientıfica una base de datos, documentada,y en un formato muy generalizado, que permite la realizacion sobre la misma deposibles simulaciones para estudiar la eficiencia de nuevas tecnicas estadısticas,en general, y de muestreo en poblaciones finitas en particular.

5. Introducir nuevas herramientas para el estudio de poblaciones como la funcionde dispersion poblacional, proponiendo estrategias para su estimacion.

Los anteriores objetivos se han plasmado en el desarrollo de un material, quepuede ser empleado como base didactica en la ensenanza de la Estadıstica a diversosniveles, o como base informativa para presentar de forma asequible la potencialidadde las tecnicas que emplea esta ciencia para estudiar las poblaciones. Este materialconsiste basicamente en:

Una librerıa de programas que permiten simular los procesos del muestreo y laestimacion de parametros sobre poblaciones.

Una descripcion de los programas que forman esta librerıa, y de su utilizacion,mediante ejemplos realizados sobre una poblacion real, que se describira masadelante.

Un conjunto de transparencias cuya informacion complementa el empleo de losmencionados programas.

Teniendo en cuenta que este material puede ser empleado en niveles muy dife-rentes, hemos intentado que sea asequible aunque no trivial, y ademas, indicamos entodo caso posibles fuente para profundizar en los diferentes topicos que se tratan.

Descripcion de la poblacion empleada

Los datos de la poblacion que vamos a emplear han sido recogidos a partir dediferentes bases de datos, de la Red informatica Cientıfica de Andalucıa, RICA, yque el Instituto de Estadıstica de Andalucıa ha puesto a disposicion de alumnos,profesores, cientıficos e investigadores en general, en el Centro Informatico Cientıficode Andalucıa, CICA.

En estas bases de datos iniciales, POBL91.DAT, con datos de poblacion,T491.DAT, con datos sobre vehıculos, TABLA1.DAT con datos sobre locales, yVIVIE1.DAT, sobre vivienda, se encuentran todas las localidades de la Comunidad

Page 6: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INTRODUCCION 3

Autonoma Andaluza, con diferentes informaciones de tipo demografico, economico ysociologico.

Para construir la base da datos que utilizaremos, y para la que hemos escogido elformato DBF, por lo generalizado que esta en diferentes ambitos y su facilidad demanejo y conversion a otros formatos, hemos reunido la informacion de las anterior-mente mencionadas, pero eliminando aquellas localidades que por su gran importanciapodrıan distorsionar los resultados finales, ya que en tales situaciones de elementosmuy diferentes del resto, es necesario emplear tecnicas especiales de muestreo, conlas cuales, dichos elementos entran necesariamente en la muestra, y a su vez sonestudiados mediante muestreo. Vease Hansen, Hurwitz y Madow (1953) y Sarndal,Swensson y Wretman (1992). Pensemos, por ejemplo, que la ciudad de Sevilla superaen habitantes a todas las localidades de la provincia juntas.

De esta forma, hemos eliminado las capitales de provincia, y ademas la ciudad deJerez de la Frontera, con lo cual hemos obtenido una base de datos con mayor homo-geneidad de sus elementos en relacion a las variables que se estudian. Hemos obtenidoası una base de datos con N = 757 elementos, que denominaremos DCA757, indi-cando con ello su tamano, y que los Datos que contiene pertenecen a la ComunidadAutonoma Andaluza. Ası, la estructura de la base de datos DCA757 queda compuestapor los siguientes campos,

NID: Numero de identificacion (de 1 a 757).

CODIGO: Compuesto por 5 cifras (Provincia/Municipio).

PUEBLO: Nombre del municipio.

PROV: Codigo de la provincia (1: Almerıa, 2: Cadiz, 3: Cordoba, 4: Granada,5: Huelva, 6: Jaen, 7: Malaga, 8: Sevilla).

VIVIENDAS: Total viviendas familiares y alojamientos. Censo de 1991.

P DERECHO: Poblacion de derecho. Censo de 1991.

P HECHO: Poblacion de hecho. Censo de 1991.

TURISMOS: Total de turismos. Censo de 1991.

LOCALES: Total de locales censados. Censo de 1990.

P OCUP LOC: Numero de personas ocupadas en el total de locales. Censo de1990.

Page 7: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INTRODUCCION 4

Todos los datos de las variables anteriores se pueden encontrar tabulados en elApendice A de este trabajo. A continuacion exponemos una descripcion estadısticade las variables de nuestra poblacion,

VARIABLE MEDIA DESV.TIP.VIVIENDAS 2553,28 4606,07P DERECHO 5864,50 10206,41P HECHO 5877,72 10461,45TURISMOS 1380,11 2913,15LOCALES 314,59 631,24P OCUP LOC 846,90 1974,32

MEDIAS DE LAS VARIABLES POR PROVINCIAS

VIVIENDAS P DERECHO P HECHO TURISMOS LOCALES P OCUP LOCALMERIA 1459,16 2944,86 3000,74 769,89 182,30 500,12CADIZ 7062,55 18518,53 18866,72 4677,40 895,88 3057,43CORDOBA 2342,23 6112,14 6018,08 1285,04 335,43 813,78GRANADA 1461,04 3205,41 3142,23 724,20 157,27 383,10HUELVA 1898,96 3858,06 3840,23 772,06 218,33 514,01JAEN 2341,44 5624,98 5506,09 1131,55 281,42 784,00MALAGA 3926,60 6451,87 6693,18 1822,56 487,65 1094,91SEVILLA 3185,19 9183,09 9150,60 2107,19 397,87 1182,63

Page 8: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 1

Censos y muestreos. Obtencion demuestras

Puede afirmarse que, con anterioridad a principios de este siglo, y salvo prece-dentes historicos muy aislados como los trabajos de Graunt en Inglaterra o los deLaplace en Francia, la Estadıstica se enfrentaba al estudio de las poblaciones me-diante observaciones exhaustivos de las mismas o censos. Veanse Chang (1976) yHald (1990).

Este metodo exhaustivo empezo a ser cuestionado a principios de nuestro siglo,principalmente por el esfuerzo que requiere su puesta en practica, siendo Kiaer y sumetodo representativo el primer exponente de esta nueva tendencia que ha derivadoen lo que entendemos actualmente por muestreo, es decir, sustituir el estudio completode la poblacion, por el de una parte de la misma, lo suficientemente representativapara que las conclusiones que se extraigan de ella se puedan extender a la poblacioncompleta.

No vayamos a creer que los nuevos metodos propuestos por Kiaer fueron inme-diatamente aceptados. Muy al contrario, tuvieron que enfrentarse con la oposicioninicial de prestigiosos estadısticos “clasicos”, partidarios de la exclusiva utilizacion decensos.

En efecto, el metodo representativo fue presentado a la comunidad cientıfica, parasu debate, en la reunion del International Statistical Institute (I.S.I), celebrada enBerna en 1895, siendo la reaccion inicial negativa, principalmente por la poca recep-tividad de varios estadısticos de aquel momento. Ası, la principal oposicion, represen-tada por G. von Mayrs de la Universidad de Munich, estaba basada en la creencia deque una investigacion parcial nunca podrıa reemplazar a un censo completo. A pesarde esta resistencia, las ideas de Kiaer no fueron olvidadas, siendo debatidas en las

5

Page 9: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 6

sucesivas reuniones del I.S.I. celebradas en San Petersburgo en 1897, en Budapest en1901 y en Berlın en 1903. Es interesante observar que en esta ultima reunion, y enla discusion del metodo de Kiaer, el estadıstico frances L. March introdujo por vezprimera, aunque no con esta terminologıa, conceptos tales como muestreo aleatoriosimple sin reemplazamiento y muestreo aleatorio simple de conglomerados.Despues de un parentesis de mas de veinte anos, se elabora por fin un informe en lareunion de Roma en 1925, en el que se reconocen plenamente las ventajas del metodorepresentativo. Vease Azorın y Sanchez-Crespo (1986).

La obtencion de muestras a partir de una poblacion con N individuos o elementos,

U = {1, 2, 3, . . . , N − 1, N}

puede realizarse de formas muy diversas, existiendo numerosos metodos para selec-cionar elementos, siendo la aleatoriedad el principio basico que ha de aplicarse endicha seleccion. Con dicha aleatoriedad eliminamos las desviaciones que podrıan pro-ducirse en los resultados finales si emplearamos criterios intencionales para construirmuestras.

Este principio de aleatoriedad consiste en asignar a cada una de las muestras posi-bles una probabilidad, y escoger al azar una de ellas, empleando dicha distribucion deprobabilidades, lo que en principio podrıa realizarse mediante el metodo acumulativoo el de Lahiri, vease Fernandez y Mayor (1994).

Las ideas anteriormente expuestas se formalizan en el concepto de diseno mues-tral, d = (M, p(·)), donde M es el espacio muestral o conjunto de muestras queposibles que estamos considerando,

M = {m1,m2,m3, . . . ,mℵ}

y

p : M −→ (0, 1]

es una funcion que asigna a cada muestra su probabilidad.

Ası, el proceso de muestreo consiste, formalmente, en la seleccion de un elementode M empleando para ello la distribucion de probabilidad p(·).

Resulta evidente que dicho proceso, tal como se ha descrito, suele ser imposiblede llevar a cabo en la practica debido al elevado tamano del conjunto M que hace

Page 10: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 7

impracticable el disponer de una lista de todas las muestras posibles para obtener, alazar, una de ellas.

Por ejemplo, en los disenos de tipo universal, que son aquellos en los cuales elespacio muestral es el conjunto de todas las partes o subconjuntos de U , esto es,M = 2U , se tendra, ℵ = 2N , que suele ser una cantidad enorme. Disenos de este tiposon los siguientes,

Diseno muestral universal uniforme. M = 2U y p(·) es constante, es decir,p(m) = 2−N , ∀m ∈M .

Diseno muestral de Bernouilli. M = 2U , siendo la distribucion de probabilidad,

p(m) = pn(m)(1− p)N−n(m), ∀m ∈M

siendo p ∈ (0, 1) una constante, y denotando n(m) el tamano de la muestra m,es decir, su cardinal o numero de elementos.

Diseno muestral de Poisson. M = 2U , siendo la distribucion de probabilidad,

p(m) = Πi∈mpiΠi∈U−m(1− pi), ∀m ∈M

siendo pi ∈ (0, 1), ∀i ∈ U , constantes.

Por ejemplo, para nuestra poblacion, DCA757, cuyo tamano no es muy elevado,los disenos del tipo anterior tendrıan,

2757 = 75806547475620553474071264085083132580902637554526201715774

02529424076917413949640287492230608625380617615872544585318

38950966818415436714572405896016201728127175281260180617944

465471499803928137335448825056869507271897877839872 muestras

Podemos intentar reducir el tamano de los espacios muestrales imponiendo quetodas las muestras tengan tamano fijo, n(m) = n. Un diseno muestral con esta clasede espacio muestral es por ejemplo el diseno muestral aleatorio simple, en el cual,

M = {m ∈ 2U |n(m) = n} 4= Mn

Page 11: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 8

siendo uniforme la distribucion de probabilidad, es decir,

p(m) =1(N

n

) ∀m ∈Mn

Aun ası, los espacios muestrales siguen siendo enormes, pues,

CARD(Mn) =

(N

n

)

Por ejemplo, para la poblacion que estamos considerando, DCA757, tendremoslos siguientes tamanos de espacio muestral segun n sea 10, 15 y 20,

CARD(M10) =

(757

10

)= 16042438105216626803700

CARD(M15) =

(757

15

)= 10216714218214095503975204346600

CARD(M20) =

(757

20

)= 1218543038524700939269269697140864217575

Es necesario pues idear procedimientos algorıtmicos, de tipo secuencial, que per-mitan construir la muestra por sucesivas extracciones de elementos, pero de forma queel mecanismo probabilıstico empleado respete las probabilidades finales del diseno.

Para ilustrar esta cuestion vamos a exponer varios procedimientos de este tipo, quepermiten obtener muestras pertenecientes al diseno muestral de Bernoulli, al disenomuestral aleatorio simple, y finalmente al diseno sistematico.

1.1. Muestreo de Bernoulli

El muestreo de Bernoulli consiste en recorrer la poblacion, elemento a elemen-to, desde el primero hasta el ultimo, en un determinado orden, de forma que cadaelemento es seleccionado con probabilidad p ∈ (0, 1), e independientemente de losdemas. Es evidente que este algoritmo, despues de una exploracion completa de U , lo

Page 12: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 9

que requiere N pasos, ha obtenido una muestra perteneciente al diseno de Bernouilli.Vease Fernandez y Mayor (1994).

El proceso completo se realiza con el programa MMBZ, que tiene tres parametrosde entrada,

1. El nombre del fichero conteniendo la poblacion.

2. El valor del parametro p.

3. Una cadena de caracteres conteniendo las variables a listar separadas por comas.

Para este diseno, hemos visto que el tamano de la muestra no es fijo, de hecho,resulta evidente que se trata de una variable aleatoria binomial, Bi(N, p), siendoentonces su esperanza, E[n(m)] = NP , por lo que, tomando adecuadamente el valorde p se puede controlar, en media, el tamano muestral.

Si por ejemplo queremos obtener una muestra de tamano medio igual a 12, enla poblacion CAA757, y queremos listar, para la muestra, las variables PUEBLO,P DERECHO y LOCALES, tendremos que 12 = 757 × p, de donde obtenemosp = 12/757. Y ejecutando la instruccion,

.DO MMB WITH ’DCA757’,12/757,’PUEBLO,P_DERECHO,LOCALES’

obtenemos,

(MMBZ) LA MUESTRA OBTENIDA ES:

============================================================

NID, PUEBLO,P_DERECHO,LOCALES

============================================================

28 CANJAYAR 1826 105

192 PEDROCHE 1899 96

205 VALSEQUILLO 556 43

485 CASTELLAR DE SANTISTEBAN 3675 151

507 IZNATORAF 1266 45

534 SANTIAGO DE CALATRAVA 1005 47

553 VILLARDOMPARDO 1278 55

586 BORGE, EL 1066 56

636 RINCON DE LA VICTORIA 12601 698

707 HUEVAR 2121 125

============================================================

LA MUESTRA TIENE 10 ELEMENTOS

============================================================

Page 13: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 10

1.2. Algoritmo MAS de aceptacion y rechazo

Para obtener una muestra del diseno muestral aleatorio simple podemos emplearel siguiente algoritmo, que permite construir la muestra por agregacion sucesiva deelementos,

1) m := {}

2) Seleccionar un elemento u ∈ U , al azar (con probabilidad 1/N)

3) Si u 6∈ m hacer m := m ∪ {u}

4) Si CARD(m) = n, detener el proceso. En caso contrario, volver al paso (2).

Como se demuestra en Fernandez y Mayor (1994), el algoritmo anterior generamuestras aleatorias simples. Para llevarlo a la practica, seleccionamos un elemento dela poblacion con igual probabilidad, 1/N , y lo marcamos, de manera que, si vuelve aser seleccionado, no entre en la muestra, repitiendo el proceso hasta tener n elementosdistintos.

Con el programa MMASZ , podemos realizar dicho algoritmo sobre un fichero quecontiene los elementos de la poblacion, siendo tres los parametros de entrada,

1. El nombre del fichero conteniendo la poblacion.

2. El tamano de la muestra.

3. Una cadena de caracteres conteniendo las variables a listar separadas por comas.

Por ejemplo, para obtener una muestra de tamano n = 10, de la poblacionCAA757, y listar, para la misma las variables PUEBLO, TURISMOS y P HECHO,ejecutamos la instruccion,

.DO MMASZ WITH ’DCA757’,10,’PUEBLO,TURISMOS,P_HECHO’

Page 14: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 11

obteniendose un resultado como el siguiente,

(MMASZ) LA MUESTRA OBTENIDA ES:

============================================================

NID, PUEBLO,TURISMOS,P_HECHO

============================================================

509 JAMILENA 501 2976

370 VALOR 167 1019

403 CANAVERAL DE LEON 81 548

685 CASTILLEJA DE LA CUESTA 4379 15205

257 CASTILLEJAR 364 1985

679 CANADA ROSAL 326 2834

102 ZURGENA 591 2050

508 JABALQUINTO 422 2495

641 SEDELLA 77 466

417 GALAROZA 316 1538

============================================================

1.3. Algoritmo FMR de exploracion secuencial

El metodo FMR de exploracion secuencial ha sido propuesto por Fan, Muller yRezucha (1962), y consiste en recorrer secuencialmente la poblacion de manera quepara j = 1, 2, . . . N , se selecciona el elemento j de la poblacion con probabilidad,

n− njN − j + 1

siendo nj el numero de elementos ya seleccionados en las j − 1 primeras inspeccionessi j > 1, y n1 = 0. El procedimiento finaliza cuando nj = n.

En la realizacion practica del metodo, se explora secuencialmente la poblacion, ypara cada elemento se genera un numero aleatorio, r, entre 0 y 1.

En caso de que r ≤ (n− nj)/(N − j + 1), se introduce el elemento en la muestra.Cuando de esta forma hayamos seleccionado n elementos, detenemos el proceso. VeaseFernandez y Mayor (1994).

El programa FMRZ, aplica este metodo para obtener una muestra. Sus parametrosde entrada son tres,

1. Nombre del fichero conteniendo la poblacion.

Page 15: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 12

2. Tamano de la muestra a obtener.

3. Una cadena de caracteres conteniendo los nombres de las variables a listar,separadas por comas.

Si por ejemplo queremos obtener una muestra de tamano n = 10, de la poblacionDCA, con los valores de las variables PUEBLO, PROV y VIVIENDAS, ejecutamosla instruccion,

.DO FMRZ WITH ’DCA757’,10,’PUEBLO,PROV,VIVIENDAS’

obteniendo el siguiente resultado,

(FMRZ) LA MUESTRA OBTENIDA ES:

=========================================================

NID, PUEBLO,PROV,VIVIENDAS

=========================================================

17 ARMUNA DE ALMANZORA 1 180

74 PURCHENA 1 753

120 GRAZALEMA 2 1322

194 POSADAS 3 2607

223 ALBUNUELAS 4 801

453 VALDELARCO 5 232

532 SABIOTE 6 1858

591 CANETE LA REAL 7 1130

657 ALANIS 8 933

715 MAIRENA DEL ALJARAFE 8 8441

=========================================================

1.4. Muestreo sistematico

En determinadas situaciones, las poblaciones en estudio presentan una estructuralimita la obtencion de las muestras por procedimientos usuales. Pensemos por ejemploen un muestreo de campo que realiza un encuestador sobre los individuos que vanemitiendo su voto en una consulta electoral, o las encuestas que se realizan en la calle,donde se ha de preguntar a las personas que circulan por la misma, pero utilizando unmecanismo probabilıstico. Otro ejemplo tıpico lo constituyen los estudios de controlde calidad sobre objetos que van saliendo de una cadena de produccion.

Page 16: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 13

Para situaciones de este tipo se ha ideado el muestreo sistematico, en el cual loselementos son seleccionados siguiendo, basicamente, una regla del tipo “seleccionar unelemento de cada cierto numero de ellos que se van presentando secuencialmente”. Ası,podemos decir que un diseno muestral sistematico es un diseno muestral cuyo espaciomuestral esta formado por muestras sistematicas, es decir, las unidades muestreadasse escogen de la poblacion mediante la eleccion de una unidad de partida y las demaspor una regla sistematica de seleccion del tipo anteriormente mencionado.

El diseno sistematico mas sencillo, que denotaremos por MS(N, k), es el disenosistematico uniforme de paso k. Se basa en considerar una lista con las unidadesde la poblacion,

U = {1, 2, . . . , k, . . . , N}

y aplicar el siguiente procedimiento,

1. Se escoge un numero aleatorio entero γ ∼ U [1..k] siendo k ≤ N un entero de-terminado de antemano. El valor de γ nos indica la unidad inicial a seleccionar.

2. Se construye la muestra,

mγ = {γ, γ + k, γ + 2k, . . . . . .}

hasta agotar la poblacion.

Es facil ver que con esta regla las muestras siempre tienen tamano n = N/k si Nes multiplo de k. En caso contrario, si N = kn + r, 0 < r < k, las muestras puedentener tamano n o n + 1, segun γ > r o γ ≤ r, existiendo k muestras posibles, queademas son disjuntas.

Aunque la poblacion con la que estamos trabajando, DCA757, no presenta unaestructura tal que sea necesario emplear sobre ella el muestreo sistematico, nosotrossı la utilizaremos para ello con el fin de ilustrar la obtencion de muestras medianteeste procedimiento, tal como se describe a continuacion.

El programa MSZ realiza la extraccion de una muestra sistematica aplicando elprocedimiento anteriormente indicado. Este programa tiene tres parametros de en-trada,

1. Nombre del fichero conteniendo la poblacion.

Page 17: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 14

2. Valor del parametro k.

3. Nombre de las variables a listas, separadas por comas.

Por ejemplo, si queremos construir una muestra sistematica a partir de la po-blacion DCA757, tomando k = 70, de forma que se obtengan los nombres de laslocalidades y los valores de las variables TURISMOS y VIVIENDAS, ejecutaremos lainstruccion,

.DO MSZ WITH ’DCA757’,70,’PUEBLO,TURISMOS,VIVIENDAS’

obteniendose,

(MSZ) LA MUESTRA OBTENIDA ES:

============================================================

NID, PUEBLO,TURISMOS,VIVIENDAS

============================================================

34 CHERCOS 57 193

104 ALCALA DEL VALLE 670 1442

174 GUADALCAZAR 245 431

244 BUBION 62 328

314 LECRIN 531 1200

384 ALAJAR 128 516

454 VALVERDE DEL CAMINO 3184 5187

524 PEAL DE BECERRO 1091 2476

594 CARTAMA 2830 3690

664 ALMADEN DE LA PLATA 261 922

734 PUEBLA DE LOS INFANTES, LA 670 1647

============================================================

n = 11

============================================================

Transparencia de apoyo: A-1. Con esta transparencia hemos pretendido ilustrarla idea de la contraposicion existente entre un censo, en el cual la poblacion se estudiade forma exhaustiva, y un muestreo, en el que el estudio se reduce a una parte de

Page 18: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

CENSOS Y MUESTREOS. OBTENCION DE MUESTRAS 15

la poblacion, usualmente mucho mas pequena, y extraıda mediante un mecanismoprobabilıstico que se formaliza mediante el concepto de diseno muestral, d = (M, p(·)).Transparencia de apoyo: A-2. En esta transparencia, se intenta plasmar la idea deobtencion de muestras, por procedimientos secuenciales, particularizando al muestreode Bernoulli, al aleatorio simple y al sistematico.

Page 19: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 2

Estadısticos, estimadores y sudistribucion

Ya hemos visto, en el capıtulo 1, los aspectos del muestreo relativos a la obtencionde partes de la poblacion, es decir, muestras, que nos serviran para realizar las infe-rencias. Ahora veremos como procede la teorıa del muestreo para llevar a cabo estasinferencias.

En general, el objetivo final de muestreo es la estimacion de un parametro pobla-cional del tipo,

θ = f(Y1, Y2, . . . , YN)

siendo Y = (Y1, Y2, . . . , YN) ∈ RN una variable de estudio definida sobre cadaelemento de la poblacion. Los parametros mas empleados suelen ser de tipo lineal,siendo los mas usuales,

Media poblacional.

Y =1

N

∑i∈U

Yi

Total poblacional.T (Y ) =

∑i∈U

Yi

Con el fin de estimar un parametro poblacional, la teorıa del muestreo emplea,en forma similar a como lo hace la Estadıstica Matematica, determinadas funciones

16

Page 20: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ESTADISTICOS ESTIMADORES Y SU DISTRIBUCION 17

muestrales o estadısticos. En nuestro contexto, entenderemos por estadıstico unafuncion real de variable muestral, e(·), esto es,

e : M −→ R

Por ejemplo, dado el diseno muestral aleatorio simple, cuyo espacio muestral, Mn,ya hemos definido en el capıtulo 1, podemos definir el estadıstico media muestral,

y(m) =1

n

∑i∈m

Yi

y el estadıstico cuasivarianza muestral,

s2y(m) =

1

n− 1

∑i∈m

(Yi − y(m))2

Un proceso, ya sea “analogico” ya sea mas “formal”, permitira justificar el em-pleo de un determinado estadıstico para estimar un parametro, en cuyo caso, dichoestadıstico sera considerado como estimador. Por ejemplo, podemos decidir el em-pleo del estadıstico y(m) como estimador de Y , y en tal caso diremos que y es unestimador de Y , lo que escribiremos con la notacion siguiente,

Y = y

Dado un diseno muestral, d = (M, p(·)), y un estadıstico, e(·), definido sobre M ,la distribucion de probabilidad definida por p(·) induce sobre e(M) una distribucion,pe(·),

pe : e(M) −→ [0, 1]

denominada distribucion de e(·) en el muestreo, vease Fernandez y Mayor (1994),y definida de la siguiente forma,

pe(x) = p(e−1(x)) =∑m∈Me(m)=x

p(m) ∀x ∈ e(M)

La distribucion exacta de los estadısticos en el muestreo es, en general, imposiblede obtener pues requiere un calculo exhaustivo sobre todas las muestras posibles, sinembargo, sı es posible realizar un estudio descriptivo de estas distribuciones simulando

Page 21: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ESTADISTICOS ESTIMADORES Y SU DISTRIBUCION 18

la obtencion de muestras de un diseno, valorando cada muestra obtenida mediante elestadıstico considerado y procesando el conjunto de valores ası obtenido mediante unprograma estadıstico apropiado.

El programa DMMASZ simula la extraccion de muestras aleatorias simples de unapoblacion, y para cada una de ellas calcula el estadıstico media muestral para unavariable Y , e(m) = y(m) =

∑m Yi/n(m). El programa tiene cuatro parametros de

entrada,

1. El nombre del fichero conteniendo la poblacion.

2. El nombre de la variable Y para la cual se calcula el estadıstico.

3. El tamano de las muestras a extraer.

4. El numero de muestras a extraer.

Por ejemplo, si queremos hallar la media de la variable TURISMOS, sobre 1500muestras aleatorias de tamano n = 15, extraıdas de la poblacion DCA757, ejecutamosla instruccion,

.DO DMMASZ WITH ’DCA757’,’TURISMOS’,15,1500

obteniendo ası 1500 valores de y(m). En la figura 2.1. de las paginas siguientes, apareceuna representacion de la distribucion de frecuencia de estos valores.

El programa DCMASZ es similar al anterior pero valora el estadıstico cuasiva-rianza muestral,

e(m) = s2y(m) =

1

n(m)− 1

∑i∈m

(Yi − y(m))2

siendo similares los parametros de entrada. En la figura 2.2. de las paginas siguientes,se representa la distribucion de frecuencias de los valores obtenidos ejecutando lainstruccion,

.DO DCMASZ WITH ’DCA757’,’TURISMOS’,15,1500

es decir, valorando la cuasivarianza muestral de la variable TURISMOS sobre 1500muestras aleatorias de tamano 15.

Con pequenas modificaciones, es posible emplear estos programas para estudiarlas distribuciones de estadısticos de estructura mas compleja como pueden ser la razon

Page 22: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ESTADISTICOS ESTIMADORES Y SU DISTRIBUCION 19

entre dos medias muestrales, R(m) = y(m)/x(m), para dos variables, Y y X, o el(cuasi)coeficiente de variacion muestral, cvy(m) = sy(m)/y(m), y tambien usandootros disenos muestrales como el de Bernoulli o Poisson, expuestos en el capıtulo 1.

Transparencia de apoyo: B-1. En esta imagen, visualizamos el concepto de es-tadıstico como funcion muestral, que posee una distribucion de probabilidad inducidapor la distribucion de probabilidad, p(·), asociada al diseno muestral.

Page 23: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ESTADISTICOS ESTIMADORES Y SU DISTRIBUCION 20

FIGURA 2.1. Distribucion de la media muestral de la variable TURISMOS en lapoblacion DCA757, bajo diseno muestral aleatorio simple con n = 15

Page 24: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

ESTADISTICOS ESTIMADORES Y SU DISTRIBUCION 21

FIGURA 2.2. Distribucion de la cuasivarianza muestral de la variable TURISMOS en lapoblacion DCA757, bajo diseno muestral aleatorio simple con n = 15

Page 25: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 3

Disenos uniformes y no uniformes.Muestreo aleatorio simple “versus”muestreo con probabilidadesvariables

Entendemos por diseno muestral uniforme al que proporciona a todos los elementosde la poblacion igual probabilidad de aparecer en la muestra, es decir, tecnicamentehablando, posee probabilidades de inclusion de primer orden iguales. Obviamente, siun diseno, d = (M, p(·)), proporciona a todas las muestras posibles las mismas pro-babilidades, y ademas, un elemento cualquiera siempre aparece en el mismo numerode muestras, entonces dicho diseno es uniforme, ya que sabemos, vease Fernandez yMayor (1994),

πi =∑

m∈Mm3i

p(m) ∀i ∈ U

Tal es al caso de diseno muestral aleatorio simple, MAS(N, n), considerado en elcapıtulo 1, y para el cual, al ser,

p(m) =1(N

n

) ∀m ∈M

y al estar todo elemento en(N−1n−1

)muestras, verifica πi = n/N ∀i ∈ U .

22

Page 26: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 23

Se puede decir pues que cualquier procedimiento de muestreo aleatorio simple, esdecir, que proporcione dicho diseno, es “democratico” en el sentido de no establecerdiferencias entre los elementos, sea cual sea su importancia. La ventaja de este tipode muestreos radica en la facilidad de obtencion de la muestra, y en la sencillez delos estimadores de la media o el total poblacionales en el estudio del error.

No obstante es facil entender que al dar la misma importancia a alementos quepueden ser muy dispares, puede ocasionar estimaciones poco acuradas, sobre todo si lapoblacion presenta una elevada dispersion en relacion a la variable que se estudia. Ellose corrobora matematicamente, si observamos el estimador de Horvitz-Thompson dela media poblacional de Y , y su varianza, vease Sarndal, Swensson y Wretman (1992),

Y = y =1

n

∑i∈m

Yi

V [Y ] =1− fn

S2y

donde f = n/N y S2y representa la cuasivarianza poblacional de la variable Y ,

S2y =

1

N − 1

∑i∈U

(Yi − Y )2

De esta forma, cuando la poblacion presenta una dispersion elevada, el disenomuestral aleatorio simple puede no ser la mejor eleccion. Para tales situaciones, eslogico pensar que resulta mas apropiado un procedimiento de muestreo que generaun diseno muestral en el cual las probabilidades de inclusion de primer orden estenafectadas por la importancia de los elementos, de forma que los mas relevantes ten-gan tales probabilidades mas grandes. Por ejemplo, si pudieramos conseguir que lasprobabilidades de inclusion de primer orden fueran proporcionales a la variable Y , esdecir,

πi ∝ Yi ∀i ∈ U

y si el diseno muestral es de tamano fijo, n(m) = n, como la varianza del estimadorde Horvitz-Thompson de la media es, vease Hedayat y Sinha (1991),

V [Y ] = − 1

2N2

∑∑i,j∈U

(πij − πiπj)(Yiπi− Yjπj

)2

Page 27: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 24

es claro que dicha varianza se anularıa, y la estimacion carecerıa de error. Obviamente,esto no se puede realizar en la practica pues no se puede extraer un elemento conprobabilidad proporcional a una cantidad que todavıa no se conoce.

No obstante, sı es posible emplear una variable auxiliar, X, que si se conozcacompletamente, y que este de alguna forma relacionada con la variable de estudio, Y ,en el sentido de que los elementos mas importantes tengan mayor valor de X. Unavariable de este tipo, y que supondremos positiva, se suele denominar tamano, yaquellos disenos muestrales cuyas probabilidades de inclusion de primer orden seanproporcionales a X,

πi ∝ Xi ∀i ∈ U

es decir, al tamano, se conocen como disenos ΠPS1, usando la terminologıa inglesa,que no hemos querido modificar por su generalizacion.

Es evidente, que si X e Y estuvieran ligadas por una relacion de proporcionalidaddirecta exacta, tambien se obtendrıa varianza de la estimacion nula. Esta situacion esideal, pero en la practica se daran con cierta aproximacion, produciendo una reduccionen el error de muestreo.

En la literatura de muestreo se han propuesto gran cantidad de procedimientosque generan disenos muestrales de tipo ΠPS, recomendandose la consulta de Brewery Hanif (1983) y de Chaudhuri y Vos (1988) para el estudio de muchos de ellos. Aquı,expondremos brevemente uno de ellos, propuesto por Sampford (1967), que servira co-mo exponente de las dificultades practicas que presentan este tipo de metodos. Endicha descripcion emplearemos la notacion αi = Xi/T (X).

Con el metodo de Sampford los elementos son seleccionados con reemplazamiento,de acuerdo con las siguientes reglas,

1. Seleccionar el primer elemento con probabilidad αi = Xi/T (X), siendo X lavariable auxiliar.

2. Seleccionar los n− 1 restantes elementos con probabilidades proporcionales a,

αi1− nαi

3. Finalizada la extraccion, la muestra es aceptada si todos los elementos sondiferentes. En caso contrario se rechaza, y se vuelve al paso 1.

1Inclusion Probabilities Proporcional to Size

Page 28: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 25

Se demuestra que con este procedimiento, πi = nαi, y ademas,

0 < πij < πiπj, i 6= j

lo que asegura que el estimador usual de la varianza es no negativo, vease Fernandezy Mayor (1994).

El calculo de expresiones exactas para las probabilidades de inclusion de segundoorden es, en general, extraordinariamente complicado. La siguiente expresion asintoti-ca, dada por Asok y Sukhatme (1976), es una aproximacion de orden N−4.

πij ≈ n(n− 1)αiαj(1 + [(αi + αj)−

∑k∈U

α2k]+

[2(α2i + α2

j )− 2∑k∈U

α3k − (n− 2)αiαj + (n− 3)(αi + αj)

∑k∈U

α2k − (n− 3)(

∑k∈U

α2k)

2])

Seguidamente exponemos los pasos que hay que seguir para realizar la estimacionde un parametro lineal.

1. Calcular el total de la variable auxiliar, X, que servira para hallar las probabi-lidades αi. Calcular

∑k∈U α

2k y

∑k∈U α

3k que se utilizaran en la aproximacion de

πij.

2. Calcular el total de los valores αi/(1− nαi) y normalizarlos para obtener α′i,

α′i =

αi1− nαi∑

i∈U

αi1− nαi

3. Extraer el primer elemento con probabilidad αi y los restantes con α′i, conreemplazamiento. Si se detecta una repeticion, volver a iniciar las extracciones.

4. Una vez extraıda la muestra, aplicar el estimador de Horvitz-Thompson y es-timar su varianza, lo que previamente requiere el calculo de las πij correspon-dientes, usando la formula asintotica.

Como puede verse, el proceso completo resulta ciertamente complejo, sobre todosi se compara con el que habrıa de realizar si el diseno fuera el aleatorio simple. Decualquier forma, la reduccion de error de muestreo puede justificar lo laborioso delmetodo.

Page 29: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 26

Para ilustrar estas cuestiones, hemos elaborado, en primer lugar, el programaEMMASZ, que realiza la extraccion de una muestra aleatoria y la estimacion de lamedia de una variable. Este programa tiene tres parametros de entrada,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de muestra a obtener.

3. Variable de estudio, sobre la que se realiza la estimacion.

Por ejemplo, si queremos estimar, en la poblacion DCA757, la media de la variableTURISMOS, mediante una muestra de tamano n = 10, ejecutaremos la siguienteinstruccion,

.DO EMMASZ WITH ’DCA757’,10,’TURISMOS’

y obtendremos un resultado como el que sigue,

(EMMASZ)

========================================

NID,TURISMOS,TURISMOS*TURISMOS

========================================

103 915 837225

111 97 9409

369 403 162409

297 99 9801

293 166 27556

562 150 22500

549 921 848241

460 898 806404

402 203 41209

661 551 303601

========================================

SUMA = 4403

SUMA DE CUADRADOS = 3068355

CUASIVARIANZA = 125523.789

===============ESTIMACIONES=============

MEDIA ESTIMADA = 440.300

VARIANZA ESTIMADA = 12386.561

INTERVALO AL 95% = 440.300 +/- 218.138

========================================

Y -> TURISMOS

Page 30: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 27

La salida de este programa consiste en los elementos de la muestra aleatoria, losvalores de la variable de estudio y sus cuadrados y las estimaciones usuales. Comopuede verse, la estimacion no es muy acurada ya que el verdadero valor de la mediapoblacional es (vease introduccion), Y = 1380,11.

El programa SAMPFORZ, simula la extraccion de una muestra mediante el meto-do de Sampford, y realiza la estimacion de la media poblacional de una variable em-pleando el estimador de Horvitz-Thompson, y la estimacion de la varianza mediantelas expresiones asintoticas de πij, anteriormente expuestas. Sus parametros de entradason,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra.

3. Variable auxiliar.

4. Variable de estudio.

Por ejemplo, para estimar en DCA757, la media de la variable TURISMOS, em-pleando P HECHO como variable auxiliar y una muestra de tamano n = 10, ejecu-taremos la instruccion,

.DO SAMPFORZ WITH ’DCA757’,10,’P_HECHO’,’TURISMOS’

obteniendo un resultado similar al siguiente,

(SAMPFORZ)

========================================

NID,P_HECHO,TURISMOS

========================================

189 1618 231

3 20002 3693

714 14767 3417

638 35788 9174

317 20321 4627

676 25597 6869

338 4994 1091

396 12465 2408

159 8843 2383

109 21440 3341

========================================

Page 31: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

DISENOS UNIFORMES Y NO UNIFORMES 28

=============ESTIMACIONES===============

MEDIA ESTIMADA = 1262.616

VARIANZA ESTIMADA = 6832.634

INTERVALO AL 95% = 1262.616 +/- 162.013

========================================

Y -> TURISMOS X -> P_HECHO

Ahora la salida del programa consiste en los elementos de la muestra, los valoresde la variable auxiliar y los de la variable de estudio. Como puede comprobarse, estemetodo proporciona una estimacion mucho mas precisa, lo que se justifica por larelacion existente entre las variables P HECHO y TURISMOS.

El programa SAMPFORZ utiliza dos ficheros auxiliares para almacenar la muestraobtenida y las probabilidades de inclusion correspondientes. Estos ficheros se deno-minan, respectivamente, MUESTRA.DBF y PIN.DBF, y despues de la ejecucion delprograma, se pueden consultar para obtener la muestra seleccionada y las probabili-dades de inclusion. Ası pues, estos nombres estan reservados y no deben ser utilizadoscon otra finalidad.

Transparencia de apoyo: C-1. Esta transparencia expone la idea fundamentalque hemos querido recalcar en este capıtulo, es decir, la contraposicion entre disenosuniformes, como el aleatorio simple, que proporcionan las mismas probabilidades deinclusion para todos los elementos, sean cuales sean sus caracterısticas; y los muestreosno uniformes, como las ΠPS, que tienen en cuenta los tamanos de los elementos paraasignar las probabilidades de inclusion.

Page 32: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 4

¿Como estimar razones?

En numerosas situaciones reales, los parametros que nos interesa estimar se expre-san mediante razones o cocientes de medias poblacionales, dando lugar a expresionesde tipo no lineal para las cuales no son aplicables directamente los estimadores usualescomo el de Horvitz-Thompson. Por ejemplo, en la poblacion que estamos consideran-do, DCA757, con datos de la Comunidad Autonoma Andaluza, puede ser necesarioestudiar el numero medio de turismos por persona, o el numero medio de personasocupadas por local, y estos parametros adoptan la forma de razones entre las mediasde las variables indicadas. A continuacion vamos a exponer una tecnica para estimareste tipo de parametros, suponiendo que el diseno muestral empleado es el aleatoriosimple.

Sean Y y X dos variables sobre una poblacion, U , y consideramos el parametroR = Y /X, razon de medias (o totales) poblacionales. Dada una muestra aleatoria,m, podemos estimar R mediante la razon de medias muestrales,

R =y

x

cuya varianza se puede aproximar mediante tecnicas de linealizacion, Fernandez yMayor (1994), de la siguiente forma,

V [R] ≈ 1− fn

1

X2

(S2y +R2S2

x − 2RSxy)

29

Page 33: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

¿COMO ESTIMAR RAZONES? 30

que se puede estimar mediante,

V [R] =1− fn

1

x2

(s2y + R2s2

x − 2Rsxy)

Un aspecto importante de la estimacion anterior consiste en la precision que seobtiene, aunque se emplee un diseno uniforme como es el aleatorio simple, siempreque exista una relacion de proporcionalidad directa muy acusada entre las variables.En efecto, si expresamos la varianza aproximada como,

V [R] ≈ 1− fn

1

X2S

2y−Rx

observaremos que la variable Y −RX, bajo la hipotesis de relacion de proporcionali-dad aproximada, presentara poca dispersion, aunque por separado, X e Y estan muydispersas.

El programa RAMASZ realiza la extraccion de una muestra aleatoria y la estima-cion de la razon entre dos medias usando las expresiones anteriores. Este programatiene cuatro parametros de entrada,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra aleatoria a extraer.

3. Nombre de la variable Y .

4. Nombre de la variable X.

Por ejemplo, si en la poblacion DCA747 queremos estimar la razon entre las me-dias de las variables P OCUP LOC y LOCALES, mediante una muestra aleatoria detamano n = 12, lo que proporciona una tasa del numero medio de personas ocupadasen locales, ejecutamos la instruccion,

.DO RAMASZ WITH ’DCA757’,12,’P_OCUP_LOC’,’LOCALES’

Page 34: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

¿COMO ESTIMAR RAZONES? 31

obteniendo, el siguiente resultado, en el que, por brevedad, solo hacemos constar losresultados finales,

(RAMASZ)

=================================================

SUMA X = 2355

SUMA DE CUADRADOS X = 1361619

CUASIVARIANZA X = 81768.205

SUMA Y = 6048

SUMA DE CUADRADOS Y = 13535566

CUASIVARIANZA Y = 953397.636

SUMA X*Y = 4197221

CUASICOVARIANZA X,Y = 273663.727

============ESTIMACIONES=========================

RAZON ESTIMADA Y/X = 2.568152866

VARIANZA ESTIMADA = 0.185411849

INTERVALO AL 95% = 2.568152866 +/- 0.843965733

=================================================

Y -> P_OCUP_LOC X -> LOCALES

siendo el verdadero valor R = 2,692119.

Y si queremos estimar la razon entre TURISMOS y P HECHO, ejecutaremos lainstruccion,

. DO RAMASZ WITH ’DCA757’,12,’TURISMOS’,’P_HECHO’

obteniendo,

(RAMASZ)

==================================================

SUMA X = 69429

SUMA DE CUADRADOS X = 1448522057

CUASIVARIANZA X = 95165747.295

SUMA Y = 15455

SUMA DE CUADRADOS Y = 79186305

CUASIVARIANZA Y = 5389232.083

SUMA X*Y = 338163745

CUASICOVARIANZA X,Y = 22613179.886

==================================================

Page 35: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

¿COMO ESTIMAR RAZONES? 32

==================ESTIMACIONES====================

RAZON ESTIMADA Y/X = 0.222601507

VARIANZA ESTIMADA = 0.000091568

INTERVALO AL 95% = 0.222601507 +/- 0.018755460

==================================================

Y -> TURISMOS X -> P_HECHO

siendo el verdadero valor R = 2,344840.

Finalmente, con la instruccion,

. DO RAMASZ WITH ’DCA757’,12,’P_HECHO’,’VIVIENDAS’

obtendremos una tasa sobre el numero medio de personas por vivienda,

(RAMASZ)

=================================================

SUMA X = 40984

SUMA DE CUADRADOS X = 570797946

CUASIVARIANZA X = 39165811.333

SUMA Y = 92032

SUMA DE CUADRADOS Y = 2515637292

CUASIVARIANZA Y = 164528473.333

SUMA X*Y = 1194457162

CUASICOVARIANZA X,Y = 80012473.152

==============ESTIMACIONES=======================

RAZON ESTIMADA Y/X = 2.245559243

VARIANZA ESTIMADA = 0.018828852

INTERVALO AL 95% = 2.245559243 +/- 0.268947798

=================================================

Y -> P_HECHO X -> VIVIENDAS

siendo la estimacion muy cercana al verdadero valor, R = 2,302029.

Transparencia de apoyo: D-1. La idea basica que expresa esta transparencia escomo la razon o cociente entre totales (o medias) de variables, proporciona medidas

Page 36: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

¿COMO ESTIMAR RAZONES? 33

de gran interes en el estudio de poblaciones. Ası, en el ejemplo que se indica, la razonentre poblacion y vivienda proporciona una tasa de personas por vivienda. Tambiense indica la estimacion de la razon de medias poblacionales mediante la razon demedias muestrales.

Page 37: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 5

Informacion auxiliar en laestimacion: estimadores de razon yregresion

El empleo de informacion auxiliar es un recurso muy generalizado en la Estadısti-ca, y en particular en el campo del Muestreo en Poblaciones Finitas, y su fundamentoparte de una idea muy logica: si disponemos de algun tipo de informacion previa,relacionada en algun sentido con la caracterıstica de la poblacion que estamos estu-diando, podemos utilizarla para mejorar la precision de los resultados y/o facilitar laobtencion de las muestras.

La informacion auxiliar viene en general expresada por una variable, X, denomina-da variable auxiliar o variable de informacion auxiliar, total o parcialmente conocida.Esta variable puede ser de naturaleza diferente a la que se estudia, pero relacionadacon ella, por ejemplo, en nuestra poblacion DCA757, podemos emplear la informacionsuministrada por P HECHO en el estudio de la variable TURISMOS. Pero tambien,la variable auxiliar podrıa similar a la de estudio, pero considerada en un ambitogeografico o temporal distinto.

El Muestreo en Poblaciones Finitas considera diferentes formas de utilizar la in-formacion auxiliar, tanto en la fase de muestreo como en la de estimacion. Ası, enel capıtulo 3 de este trabajo hemos visto como mejorar las estimaciones mediantelos disenos ΠPS, en los cuales se usa una variable, X, para obtener probabilidadesde inclusion proporcionales a la misma. Tambien, en un capıtulo posterior, veremoscomo emplear una variable auxiliar para estructurar la poblacion de una determinadaforma, produciendo tambien una mayor precision.

En este sentido, es interesante exponer las diferentes formas de usar informacion

34

Page 38: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 35

auxiliar, segun Hedayat y Sinha (1991). estos autores enumeran las siguientes circuns-tancias,

(i) La variable o variables de informacion auxiliar son conocidas para todas lasunidades de la poblacion, se aplican en la fase de muestreo, afectando al diseno,y tambien intervienen directamente en las estimaciones.

(ii) La variable o variables de informacion auxiliar son conocidas para todas lasunidades de la poblacion, no se aplican en la fase de muestreo, pero sı intervienendirectamente en las estimaciones.

(iii) La informacion auxiliar esta disponible a partir de diferentes fuentes, pero re-sulta imposible integrarlas para su uso en el diseno muestral; a pesar de ello, seintenta investigar una integracion apropiada en la fase de estimacion, empleandotanto variables auxiliares como variables de estudio.

(iv) La informacion auxiliar se obtiene solo en la recogida de datos, y se intenta usardicha informacion en la fase de estimacion.

En este capıtulo, pretendemos ilustrar la introduccion de informacion auxiliar enel estimador, partiendo de la base de que existe una relacion acusada entre la variableque se estudia, Y , y la variable que se considera como auxiliar, X. Por ejemplo, enla Figura 5.1. presentamos la nube de puntos relativa a las variables TURISMOSy P HECHO, para la poblacion DCA757, y en ella observamos una relacion muymarcada de proporcionalidad entre ambas variables.

De esta forma, se pretende aprovechar el conocimiento sobre la variable X, y larelacion existente entre ella y la variable Y para obtener estimaciones mas acura-das. Cuando dicha relacion es del tipo anterior, es decir, de proporcionalidad directaaproximada, podemos hacer las siguientes consideraciones.

Al ser,

Y =Y

XX = RX

podemos tener en cuenta que en esta situacion, suponiendo muestreo aleatorio simple,y como ya se evidencio en el capıtulo anterior, sobre estimacion de razones, R = y/xproporciona un estimador muy apropiado para R, de donde deducimos inmediata-mente el siguiente estimador de Y ,

Y 1 =y

xX

Page 39: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 36

que se conoce con el nombre de estimador de razon de Y . Observemos que este esti-mador sera tanto mas eficiente cuanto mas exacta sea la relacion de proporcionalidadentre las variables.

Si recordamos la expresion de la varianza aproximada del estimador de la razon

dada en el capıtulo anterior, tendremos para la varianza aproximada de Y 1 y suestimacion, las siguientes formulas,

V [Y 1] ≈1− fn

(S2y +R2S2

x − 2RSxy)

V [Y 1] =1− fn

(s2y + R2s2

x − 2Rsxy)

sirviendo la ultima para proporcionar el error de la estimacion de la media cuando seutiliza el estimador de razon.

Como ya hemos indicado, el estimador de razon resulta muy eficiente si existe unarelacion de proporcionalidad directa entre las variables, lo que se traduce, graficamen-te, en una nube de puntos “rectilınea” que pasa por el origen. Sin embargo, en ciertassituaciones, aun existiendo una relacion lineal, puede no ser de proporcionalidad, sinocorregida por una constante aditiva, lo que se traduce en que la nube de puntos nopasa por el origen de coordenadas.

Para tales situaciones, es mejor emplear el estimador de regresion, cuya expresion,ası como una estimacion de la varianza, vienen dadas por,

Y 2 = y + b(X − x) b =sxys2x

V [Y 2] =1− fn

n− 1

n− 2s2y(1− r2) r =

sxysxsy

y cuyas propiedades y aplicabilidad pueden verse en Fernandez y Mayor (1994).

El programa EMINFZ simula la obtencion de una muestra aleatoria y la aplicacionde los anteriores estimadores para estimar la media poblacional de una variable Y .Los parametros de entrada de dicho programa son,

1. Nombre del fichero conteniendo la poblacion.

Page 40: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 37

2. Tamano de la muestra.

3. Nombre de la variable de informacion auxiliar, X.

4. Nombre de la variable cuya media se quiere estimar, Y .

Por ejemplo, para estimar en la poblacion DCA757 la media de TURISMOS,empleando P HECHO como variable de informacion auxiliar, a partir de una muestraaleatoria con n = 15 elementos, ejecutaremos,

.DO EMINFZ WITH ’DCA7567’,15,’P_HECHO’,’TURISMOS’

obteniendo,

(EMINFZ)

=======================================================================

NID,P_HECHO,TURISMOS,P_HECHO*P_HECHO,TURISMOS*TURISMOS,P_HECHO*TURISMOS

=======================================================================

360 657 127 431649 16129 83439

363 940 118 883600 13924 110920

13 169 47 28561 2209 7943

522 2441 235 5958481 55225 573635

61 4305 1542 18533025 2377764 6638310

683 4063 708 16507969 501264 2876604

225 3701 1055 13697401 1113025 3904555

357 417 86 173889 7396 35862

620 861 116 741321 13456 99876

648 2887 460 8334769 211600 1328020

239 357 77 127449 5929 27489

571 38827 9450 1507535929 89302500 366915150

314 2275 531 5175625 281961 1208025

556 3781 667 14295961 444889 2521927

692 4930 962 24304900 925444 4742660

========================PARAMETROS DEL MODELO=======================

COEF. CORRELACION = 0.9960921

ALFA = -75.465116

BETA = 0.245188

cv(x)/2*cv(y) = 0.4654822

====================================================================

Page 41: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 38

==============ESTIMACION SIN USAR INFORMACION AUXILIAR==============

MEDIA ESTIMADA = 1078.73333

VARIANZA ESTIMADA = 363217.94271

INTERVALO AL 95% = 1078.73333 +/- 1181.24428

=========================ESTIMACION DE RAZON========================

MEDIA ESTIMADA = 1346.92117

VARIANZA ESTIMADA = 4373.94267

INTERVALO AL 95% = 1346.92117 +/- 129.62615

======================ESTIMACION DE REGRESION=======================

MEDIA ESTIMADA = 1365.68283

VARIANZA ESTIMADA = 3051.26200

INTERVALO AL 95% = 1365.68283 +/- 108.26693

====================================================================

Y -> TURISMOS X -> P_HECHO

Esta salida proporciona la muestra con la informacion de las variables Y y X,una serie de parametros relevantes como el coeficiente de correlacion lineal muestraly los parametros de ajuste, α y β, calculados a partir de los datos muestrales de lasvariables, ası como cv(x)/2cv(y), con objeto de calibrar si el uso del estimador derazon ofrece ventajas sobre el estimador y, que es el primero que se calcula, seguidodel de razon y regresion.

El verdadero valor del parametro que se estima es en este caso Y = 1380,11, ycomo puede comprobarse, la estimacion que no emplea informacion auxiliar es muchomenos precisa que las estimaciones de razon y regresion, siendo esta ultima la mejor,en el sentido de mas proxima al verdadero valor, para la muestra obtenida en estasimulacion.

Como ilustracion adicional, estimaremos, mediante una muestra aleatoria de ta-mano n = 15, la media de LOCALES por pueblo, en DCA757, empleando nuevamentela variable P HECHO como auxiliar. Para ello, ejecutaremos la instruccion,

.DO EMINFZ WITH ’DCA7567’,15,’P_HECHO’,’LOCALES’

Page 42: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 39

obteniendo,

(EMINFZ)

===================================================================

NID,P_HECHO,LOCALES,P_HECHO*P_HECHO,LOCALES*LOCALES,P_HECHO*LOCALES

===================================================================

573 10114 467 102292996 218089 4723238

29 3060 199 9363600 39601 608940

547 31962 1804 1021569444 3254416 57659448

593 324 21 104976 441 6804

201 1163 61 1352569 3721 70943

78 154 11 23716 121 1694

603 1536 91 2359296 8281 139776

197 25969 1431 674388961 2047761 37161639

609 2125 135 4515625 18225 286875

718 2642 101 6980164 10201 266842

91 603 38 363609 1444 22914

543 13003 695 169078009 483025 9037085

460 3726 212 13883076 44944 789912

413 1924 64 3701776 4096 123136

118 3960 163 15681600 26569 645480

========================PARAMETROS DEL MODELO======================

COEF. CORRELACION = 0.9979879

ALFA = -14.060199

BETA = 0.055776

cv(x)/2*cv(y) = 0.4805435

===============ESTIMACION SIN USAR INFORMACION AUXILIAR============

MEDIA ESTIMADA = 366.20000

VARIANZA ESTIMADA = 19367.51345

INTERVALO AL 95% = 366.20000 +/- 272.76774

=========================ESTIMACION DE RAZON=======================

MEDIA ESTIMADA = 315.71249

VARIANZA ESTIMADA = 104.23329

INTERVALO AL 95% = 315.71249 +/- 20.01056

=======================ESTIMACION DE REGRESION=====================

MEDIA ESTIMADA = 313.77403

VARIANZA ESTIMADA = 83.85045

INTERVALO AL 95% = 313.77403 +/- 17.94770

===================================================================

Y -> LOCALES X -> P_HECHO

Page 43: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 40

En este caso, el verdadero valor de la media de LOCALES es Y = 314,59, corro-borandose nuevamente la mayor eficiencia de los estimadores de razon y regresion enrelacion al estimador que no hace uso de informacion auxiliar.

Transparencia de apoyo: E-1. En esta transparencia se expresa el aprovechamientode una variable auxiliar, X, conocida en toda la poblacion, para estimar la mediade la variable de estudio, Y . En el ejemplo expuesto, se supone una relacion deproporcionalidad (que se da en la realidad, como ya se ha visto en este capıtulo), yque permite construir, de una forma “heurıstica”, un estimador para Y .

Page 44: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

INFORMACION AUXILIAR EN LA ESTIMACION 41

FIGURA 5.1. Nube de puntos de TURISMOS y P HECHO en DCA757.

Page 45: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 6

El muestreo estratificado

Hasta ahora, hemos estudiado algunas cuestiones basicas de Muestreo en Poblacio-nes Finitas, relacionadas tanto con la obtencion de muestras como con la estimacionde parametros, pero sin suponer ninguna estructura especıfica en la poblacion. Eneste capıtulo, vamos a estudiar una metodologıa muy general de reduccion de errorde muestreo basada en la existencia de una estructura de particion sobre la pobla-cion, de forma que esta se divide en varias clases disjuntas o estratos, cada uno delos cuales debe presentar cierta homogeneidad en relacion a la caracterıstica que seestudia, es decir, en cada estrato los elementos deben ser lo mas parecido posible.

De esta forma, si tenemos la poblacion U dividida el L estratos, U1, U2,.., UL,realizaremos en cada uno de ellos, y de forma independiente, L muestreos segundisenos respectivos, d1, d2,.., dL, que proporcionaran L muestras, m1, m2,.., mL, apartir de las cuales realizaremos la estimacion. La justificacion de esta tecnica puedeser consultada en numerosos tratados de muestreo como Cochran (1993) o Fernandezy Mayor (1994).

La primera cuestion que planteamos es como estructurar una poblacion en es-tratos. La respuesta a este interrogante es muy variada pues depende de multiplesfactores relacionados con el conocimiento previo que tengamos de dicha poblacion.Por ejemplo, si estamos estudiando, en una poblacion de personas, una caracterısticasque sabemos difiere mucho segun los sexos, podemos estratificar en varones y mujeres.

Usualmente, se dispone de una variable auxiliar, X, totalmente conocida y relacio-nada con la de estudio, que nos puede servir para realizar la definicion de los estratos.De los numerosos metodos que existen para ello, expondremos el de Dalenius y Hod-ges (1959).

Este metodo realiza la estructuracion de una poblacion en estratos usando una

42

Page 46: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 43

variable auxiliar, conocida, y relacionada con la variable de estudio. Los estratos sedefinen de forma que la acumulacion de la raız cuadrada de la frecuencia sea constante(o lo mas uniforme posible). Para la justificacion del mismos, pueden consultarseSukhatme et al. (1984) y Cochran (1993).

Con el programa DHZ se aplica dicho metodo para construir los estratos. Susparametros de entrada son,

1. Nombre del fichero conteniendo la poblacion.

2. Variable auxiliar empleada para estratificar.

3. Numero de estratos.

4. Valor mınimo de la variable auxiliar a partir del cual se construye la tabla defrecuencias.

5. Longitud de intervalo para construir la tabla de frecuencias.

6. Nombre de fichero, con formato DBASE, en el cual se grabara la tabla defrecuencias y toda la informacion relativa a la estratificacion.

Por ejemplo, si queremos estratificar la poblacion DCA757, en L = 3 estratos,usando la variable P HECHO como variable auxiliar, construyendo intervalos de lon-gitud 7000, partiendo del valor mınimo 0, y grabando los resultados en el ficheroDCA EST, ejecutaremos la instruccion,

.DO DHZ WITH ’DCA757’,’P_HECHO’,3,0,7000,’DCA_EST’

obteniendose el siguiente resultado,

(DHZ)

==========================================================

P_HECHO ,FREC,SQRT(FREC),SQRT(FREC) ACUM.,ESTRATO

==========================================================

[0,7000) 600 24.495 24.495 1

----------------------------------------------------------

[7000,14000) 79 8.888 33.383 2

[14000,21000) 36 6.000 39.383 2

----------------------------------------------------------

Page 47: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 44

----------------------------------------------------------

[21000,28000) 14 3.742 43.125 3

[28000,35000) 7 2.646 45.771 3

[35000,42000) 7 2.646 48.416 3

[42000,49000) 4 2.000 50.416 3

[49000,56000) 2 1.414 51.830 3

[56000,63000) 3 1.732 53.563 3

[63000,70000) 1 1.000 54.563 3

[70000,77000) 0 0.000 54.563 3

[77000,84000) 1 1.000 55.563 3

[84000,91000) 1 1.000 56.563 3

[91000,98000) 1 1.000 57.563 3

[98000,105000) 1 1.000 58.563 3

==========================================================

ESTA TABLA SE GRABA EN DCA_EST.DBF

==========================================================

donde la primera columna contiene los valores, agrupados por intervalo, de la va-riable P HECHO, la segunda columna, FREC, contiene las frecuencias, la tercera,SQRT(FREC), las raıces cuadradas de las mismas, la siguiente columna, SQRT(FREC)ACUM., la acumulacion de estas, y finalmente ESTRATO indica el estrato corres-pondiente. Todos estos valores se graban en el fichero DCA EST.DBF, con el formatousual en DBASE.

Como puede verse, una gran parte de localidades, las de menos de 7000 habitantesde hecho, se han agrupado en el primer estrato. Las poblaciones con un numero dehabitantes entre 7000 y 21000, en total 115, forman un segundo estrato. Finalmente,las de mas de 21000 habitantes de hecho, 42 en total, constituyen el tercer estrato.

Para realizar a continuacion diferentes estimaciones empleando los anteriores es-tratos, hemos construido tres ficheros, denominados respectivamente, DCA757E1.DBF,DCA757E2.DBF y DCA757E3.DBF, que contienen cada uno de los estratos previa-mente definidos, con la misma estructura generica de variables que la poblacion com-pleta, DCA757.DBF.

La siguiente cuestion que planteamos es la estimacion de un parametro poblacio-nal, θ(Y ), a partir de las muestras obtenidas en cada estrato, segun diferentes disenosmuestrales. De esta forma, construiremos la siguiente estimacion generica,

θ =L∑h=1

Whθh

Page 48: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 45

donde las cantidades Wh = Nh/N , siendo Nh el numero de elementos en el estratoUh, se denominan pesos de los estratos. Por ejemplo, si θ(Y ) es la media poblacionalY , se tiene,

Y =L∑h=1

WhY h

Y si θ(Y ) es la razon R =∑U Yi/

∑U Xi, entonces,

R =L∑h=1

WhRh

La varianza se estima mediante la descomposicion habitual, esto es,

V [θ] =L∑h=1

W 2h V [θh]

Es muy importante resaltar que en cada estrato podemos emplear la combinacionde diseno y estimador mas adecuada a nuestros fines, lo que ilustraremos a continua-cion con varias simulaciones. Ası, mediante el programa PARESTZ podemos realizarlas estimaciones anteriores, empleando diferentes estrategias en cada estrato. Esteprograma solo posee un parametro de entrada,

1. Nombre de un fichero cada uno de cuyos registros contienen las operaciones arealizar en cada estrato.

Estas operaciones a realizar en cada estrato se llevan a cabo mediante rutinassimilares a programas del tipo usual, pero simplificados para dar unicamente los re-sultados basicos. Hemos construido rutinas de este tipo para los siguientes programas.

1. EMMASZ : Estimacion de la media usando muestreo aleatorio. Capıtulo 3.

2. RAMASZ : Estimacion de la razon usando muestreo aleatorio. Capıtulo 4.

3. EMINFZ : Estimacion de la media usando informacion auxiliar y estimadoresde razon y regresion. Capıtulo 5.

Page 49: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 46

y a dichas rutina les hemos denominado, respectivamente, EMMASZ6, RAMASZ6,EMRAZ6 y EMREZ6, siendo sus parametros de entrada los mismos que los de losprogramas de los que proceden. Las dos ultimas rutinas, EMRAZ6 y EMREZ6, pro-ceden del mismo programa, EMINFZ, realizando la primera una estimacion de razony la segunda, de regresion.

Por ejemplo, vamos a aplicar el programa PARESTZ para estimar la media de lavariable TURISMOS, en la poblacion DCA757, estratificada a partir de la variableP HECHO como se ha indicado anteriormente, estando los estratos en DCA757E1,DCA757E2 y DCA757E3, usando muestreo aleatorio simple en cada estrato, contamanos de muestra respectivos n1 = 12, n2 = 8 y n3 = 5

Primeramente, confeccionaremos un fichero de formato DBASE, con un unicocampo alfanumerico y tantos registros como estratos. En cada registro escribiremosla operacion adecuada en base a los programas correspondientes. Ası, para nuestroejemplo construimos un fichero que denominaremos M EST1 , con un campo alfa-numerico por registro, conteniendo los siguientes datos,

REGISTRO CAMPO 11 DO EMMASZ6 WITH ’DCA757E1’,12,’TURISMOS’

2 DO EMMASZ6 WITH ’DCA757E2’, 8,’TURISMOS’

3 DO EMMASZ6 WITH ’DCA757E3’, 5,’TURISMOS’

y a continuacion ejecutaremos la instruccion,

.DO PARESTZ WITH ’M_EST1’

obteniendo,

(PARESTZ)

=================================================================

ESTRATO,OPERACION

=================================================================

1 => DO EMMASZ6 WITH ’DCA757E1’,12,’TURISMOS’

PARAMETRO ESTIMADO = 472.5000000

VARIANZA ESTIMADA = 18837.7307576

-----------------------------------------------------------------

2 => DO EMMASZ6 WITH ’DCA757E2’, 8,’TURISMOS’

PARAMETRO ESTIMADO = 2344.2500000

VARIANZA ESTIMADA = 71643.4367236

-----------------------------------------------------------------

Page 50: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 47

-----------------------------------------------------------------

3 => DO EMMASZ6 WITH ’DCA757E3’, 5,’TURISMOS’

PARAMETRO ESTIMADO = 11987.8000000

VARIANZA ESTIMADA = 7069141.4542857

======================ESTIMACIONES GLOBALES======================

PARAMETRO ESTIMADO = 1395.7415456

VARIANZA ESTIMADA = 35248.3523202

INTERVALO AL 95% = 1395.742 +/- 367.981073

=================================================================

Como puede verse, en la salida del programa se indica la operacion realizada encada estrato y los resultados parciales obtenidos, y al final se indica la estimacionglobal. Observemos tambien la precision obtenida para la estimacion.

Tambien podemos estimar parametros de tipo no lineal como la razon de medias.Ası, si queremos estimar la razon entre las medias de las variables P HECHO yVIVIENDAS, mediante muestreo aleatorio simple en cada estrato, con tamanos demuestra respectivos n1 = 12, n2 = 6 y n3 = 4, y empleando en estimador razon demedias muestrales, confeccionamos un fichero, al que denominaremos M EST2, contres registros conteniendo las siguientes instrucciones,

REGISTRO CAMPO 11 DO RAMASZ6 WITH ’DCA757E1’,12,’P HECHO’,’VIVIENDAS’

2 DO RAMASZ6 WITH ’DCA757E2’, 6,’P HECHO’,’VIVIENDAS’

3 DO RAMASZ6 WITH ’DCA757E3’, 4,’P HECHO’,’VIVIENDAS’

y seguidamente ejecutamos la instruccion,

.DO PARESTZ WITH ’M_EST2’

obteniendo,

(PARESTZ)

=================================================================

ESTRATO,OPERACION

=================================================================

1 => DO RAMASZ6 WITH ’DCA757E1’,12,’P_HECHO’,’VIVIENDAS’

PARAMETRO ESTIMADO = 2.2105772

VARIANZA ESTIMADA = 0.0291363

-----------------------------------------------------------------

Page 51: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 48

-----------------------------------------------------------------

2 => DO RAMASZ6 WITH ’DCA757E2’, 6,’P_HECHO’,’VIVIENDAS’

PARAMETRO ESTIMADO = 2.7066963

VARIANZA ESTIMADA = 0.0050616

-----------------------------------------------------------------

3 => DO RAMASZ6 WITH ’DCA757E3’, 4,’P_HECHO’,’VIVIENDAS’

PARAMETRO ESTIMADO = 2.8205999

VARIANZA ESTIMADA = 0.1445229

======================ESTIMACIONES GLOBALES======================

PARAMETRO ESTIMADO = 2.3197908

VARIANZA ESTIMADA = 0.0188657

INTERVALO AL 95% = 2.320 +/- 0.269211

=================================================================

que como puede comprobarse, proporciona un resultado muy cercano al verdaderovalor, R = 2,3020272.

Finalmente, podemos estimar la media de la variable TURISMOS, mediante mues-treo aleatorio simple en cada estrato, con tamanos muestrales respectivos n1 = 12,n2 = 6 y n3 = 4, y aplicando el estimador de regresion en el primero, el de razonen el segundo, y la media muestra simple en el tercero. Para ello, confeccionamos unfichero, al que denominaremos M EST3, con tres registros conteniendo las siguientesinstrucciones,

REGISTRO CAMPO 11 DO EMREZ6 WITH ’DCA757E1’,12,’P HECHO’,’TURISMOS’

2 DO EMRAZ6 WITH ’DCA757E2’,6,’P HECHO’,’TURISMOS’

3 DO EMMASZ6 WITH ’DCA757E3’,4,’P HECHO’,’TURISMOS’

y seguidamente ejecutamos la instruccion,

.DO PARESTZ WITH ’M_EST3’

Page 52: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO ESTRATIFICADO 49

obteniendo,

(PARESTZ)

=================================================================

ESTRATO,OPERACION

=================================================================

1 => DO EMREZ6 WITH ’DCA757E1’,12,’P_HECHO’,’TURISMOS’

PARAMETRO ESTIMADO = 393.2000833

VARIANZA ESTIMADA = 812.2316145

-----------------------------------------------------------------

2 => DO EMRAZ6 WITH ’DCA757E2’, 6,’P_HECHO’,’TURISMOS’

PARAMETRO ESTIMADO = 2743.0186338

VARIANZA ESTIMADA = 97110.5392897

-----------------------------------------------------------------

3 => DO EMMASZ6 WITH ’DCA757E3’, 4,’TURISMOS’

PARAMETRO ESTIMADO = 12032.5000000

VARIANZA ESTIMADA = 7566265.4246032

======================ESTIMACIONES GLOBALES======================

PARAMETRO ESTIMADO = 1395.9474147

VARIANZA ESTIMADA = 26042.4195354

INTERVALO AL 95% = 1395.947 +/- 316.298212

=================================================================

Transparencia de apoyo: F-1. En esta transparencia hemos intentado transmitir laidea fundamental del muestreo estratificado, es decir, el agrupamiento de los elementosde la poblacion, segun su similitud, de manera que se forman clases muy homogeneas,con la finalidad de reducir el error de muestreo. Ası, en cada una de las clases oestratos se realizan muestreos independientes que por union de las muestras obtenidasproducen la muestra final.

Page 53: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 7

El muestreo por conglomerados

En los metodos de muestreo considerados en anteriores capıtulos, se suponıa unaaccesibilidad directa al marco de la poblacion del cual son seleccionadas las unidadespoblacionales,

U = {u1, u2, . . . , uN}

Sin embargo, en muchas situaciones no se dispone de este marco de la unidadesde la poblacion pero sı se tiene acceso a listas de algun tipo de agrupaciones delas mismas, como las manzanas de una ciudad, zonas geograficas, etc, de maneraque la poblacion esta dividida en clases, C1, C2, . . . , CM , que reciben el nombre deconglomerados, sobre los que se realiza el muestreo, obteniendose una muestra de losmismos,

mc = {Cj1 , Cj2 , . . . , Cjg}

A su vez, sobre cada conglomerado se puede considerar una estructura similar deconglomerados, sobre los cuales se realizarıa un proceso analogo, y ası sucesivamente.De esta forma, una estructura de conglomerados permite reproducir las complejasestructuras que poseen las poblaciones reales.

Podemos denotar por Uc la “poblacion de conglomerados” primarios y usaremosla notacion Cj para representar el conglomerado j de Uc. Con Ci(j) representamosel conglomerado i del conglomerado Cj, con Ck(j, i) el conglomerado k de Ci(j), yası sucesivamente. Ello se expone graficamente en la Figura 7.1.

El muestreo por conglomerados se llevara a cabo por sucesivos muestreos sobrelas diferentes estructuras consideradas, es decir, en general se trata de un proceso

50

Page 54: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 51

C1 C2. . . Cj . . . C1(j)

-

Cj

. . . Ci(j) . . .

?

C1(j, i). . .. . . Ck(j, i)

Ci(j)

C1(j, i, k). . .. . . Cl(j, i, k)

. . . -

Ck(j, i)

Ct(j, i, . . .)

C1(j, i, . . . , t) . . . Cr(j, i, . . . , t) . . .

FIGURA 7.1. Estructura general de conglomerados.

multietapico formado por la aplicacion de sucesivos disenos muestrales para obtenerlas muestras de cada etapa.

El caso mas simple de este tipo de muestreo es el muestreo por conglomeradosen una etapa, en el cual la poblacion esta dividida en conglomerados, C1, . . . , CM ,que forman las unidades primarias, y cada uno de ellos esta constituido por unidadesfinales de U , siendo Ni el numero de elementos de Ci. Una vez obtenida la muestrade unidades primarias, sobre las unidades finales de cada una de ellas no se realizaun muestreo sino que son estudiadas exhaustivamente.

La estimacion de la media poblacional a partir de muestreo por conglomera-dos de una etapa con seleccion de los mismos mediante diseno MAS(M, g) se basa

Page 55: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 52

en aplica los estimadores,

Y =1

g

∑i∈mc

MwiY (Ci) = z

V [Y ] = (1

g− 1

M)s2z

siendo Z una variable definida en la forma Zi = MwiY (Ci). Vease Fernandez yMayor (1994).

El programa EMCON1Z simula la extraccion de la muestra y calcula dichas esti-maciones. Sus parametros de entrada son,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra de conglomerados.

3. Nombre de la variable que define los conglomerados.

4. Nombre de la variable de estudio.

La variable que define los conglomerados debe ser una variable numerica quetoma todos los posibles valores entre 1 y un valor maximo. Por ejemplo, en DCA757,la variable PROV, que toma todos los valores entre 1 y 8, define la provincia a laque pertenece el municipio correspondiente, y por tanto puede servir para definir losconglomerados.

Ası, si queremos estimar la media de la variable TURISMOS, mediante una mues-tra de g = 3 conglomerados (provincias), en la poblacion DCA757, ejecutaremos lainstruccion,

.DO EMCON1Z WITH ’DCA757’,3,’PROV’,’TURISMOS’

Page 56: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 53

obteniendo un resultado del tipo,

(EMCON1Z)

========================================

CONG.,T(Ci),Ni,Zi=M*wi*T(Ci)/Ni

========================================

8 214933 102 2271.419

6 107498 95 1136.042

5 60221 78 636.417

==============ESTIMACIONES==============

MEDIA ESTIMADA = 1347.959

VARIANZA ESTIMADA = 146247.710

INTERVALO AL 95% = 1347.959 +/- 749.550

========================================

Y -> TURISMOS

Tambien es posible estimar la razon R = Y /X, mediante las expresiones,

R =

∑i∈mc

Ty(Ci)∑i∈mc

Tx(Ci)

V [R] = (1

g− 1

M)

1(1

g

∑i∈mc

Tx(Ci))2

1

g − 1

∑i∈mc

(Ty(Ci)− R Tx(Ci)

)2

El programa RACON1Z simula la extraccion de la muestra y calcula las estima-ciones anteriores. Sus parametros de entrada son,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra de conglomerados.

3. Nombre de la variable que define los conglomerados.

4. Nombre de la variable en el numerador, Y .

5. Nombre de la variable en el denominador, X.

Page 57: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 54

La variable que define los conglomerados ha de cumplir las mismas especificacionesindicadas para el programa EMCON1Z.

Por ejemplo, si queremos estimar la razon entre la media de P HECHO y lamedia de VIVIENDAS, usando una muestra aleatoria simple de g = 3 conglomerados,ejecutarıamos la instruccion,

.DO RACON1Z WITH ’DCA757’,3,’PROV’,’P_HECHO’,’VIVIENDAS’

obteniendo,

(RACON1Z)

=============================================

CONG.,Ni,Ty(Ci),Tx(Ci)

=============================================

6 95 523079 222437

1 102 306075 148834

3 74 445338 173325

==============ESTIMACIONES===================

RAZON ESTIMADA = 2.34025222

VARIANZA ESTIMADA = 0.01064384

INTERVALO AL 95% = 2.34025222 +/- 0.20221125

=============================================

Y -> P_HECHO X -> VIVIENDAS

Como puede verse, para cada conglomerado muestreado se indica el tamano y lostotales de las variables Y y X, ademas de las estimaciones. Este programa puede serempleado para obtener tambien la estimacion de la media basada en razon, para ellobasta usar en el denominador la variable Y ≡ 1. Por ejemplo, para estimar la mediade TURISMOS, con g = 3 conglomerados, ejecutamos,

. DO RACON1Z WITH ’DCA757’,3,’PROV’,’TURISMOS’,’1’

Page 58: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 55

obteniendo,

(RACON1Z)

==================================================

CONG.,Ni,Ty(Ci),Tx(Ci)

==================================================

7 99 180433 99

6 95 107498 95

5 78 60221 78

==============ESTIMACIONES========================

RAZON ESTIMADA = 1279.97058824

VARIANZA ESTIMADA = 58969.72024604

INTERVALO AL 95% = 1279.97058824 +/- 475.96016356

==================================================

Y -> TURISMOS X -> 1

Para estimar la media poblacional a partir de un muestreo por conglomeradosen dos etapas, con seleccion de conglomerados y unidades finales mediante muestreoaleatorio simple se aplican los estimadores siguiente, vease Fernandez y Mayor (1994)

Y =1

g

∑i∈mc

Mwiyi = z

V [Y ] = (1

g− 1

M)s2z +

M

g

∑i∈mc

w2i (

1

ni− 1

Ni

)s2i

donde Z es una variable auxiliar definida como Zi = Mwiyi, i ∈ mc.

El programa EMCON2Z simula la extraccion de la muestra y calcula las estima-ciones anteriores. Sus parametros de entrada son,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra de conglomerados.

3. Fraccion del tamano del conglomerado que se tomara como tamano de muestradentro del mismo.

4. Nombre de la variable que define los conglomerados.

5. Nombre de la variable de estudio.

Page 59: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 56

La variable que define los conglomerados ha de cumplir las mismas especificacionesindicadas para el programa EMCON1Z, anteriormente descrito.

En cuanto a la fraccion indicada en el tercer parametro, es una cantidad, f , talque ni/Ni = f ∀ ∈ mc. En la practica, ello no es posible en general, de forma exacta,al ser ni y Ni enteras. El programa EMCON2Z toma ni como la parte entera de fNi,con lo cual realmente se tendra ni ≈ fNi. Observemos que un muestreo bietapico deeste tipo, con ni proporcional a Ni se conoce con el nombre de “autoponderado”.

Por ejemplo, si queremos estimar la media de gastos de alimentacion, AL, a partirde la extraccion con muestreo aleatorio simple de g = 5 conglomerados y poste-rior muestreo en los conglomerados usando tambien muestreo aleatorio simple contamanos de muestra ni ≈ Ni/8, ejecutaremos la instruccion,

.DO EMCON2Z WITH ’DCA757’,3,1/8,’PROV’,’TURISMOS’

obteniendo,

(EMCON2Z)

============================================================

CONG.,Ni,ni,yi,Zi=M*wi*yi,si^2

============================================================

4 167 20 1048.350 1850.192 2445030.239

5 78 9 959.444 790.876 931366.528

8 102 12 1495.750 1612.328 5205313.477

========================ESTIMACIONES========================

MEDIA ESTIMADA = 1417.799

VARIANZA ESTIMADA = 99446.052

INTERVALO AL 95% = 1417.799 +/- 618.087

============================================================

Y -> TURISMOS

donde, ademas de las estimaciones, se indica para cada conglomerado su tamano, Ni,el tamano de muestra obtenida en el mismo, ni, el valor de yi, la variable auxiliar, Z,y la cuasivarianza muestral correspondiente, s2

i .

Para estimar la razon de medias a partir de un muestreo por conglomerados endos etapas, con seleccion de conglomerados y unidades finales mediante muestreo

Page 60: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 57

aleatorio simple se aplican los estimadores, vease Fernandez y Mayor (1994),

R =

∑i∈mc

Niyi∑i∈mc

Nixi

V [R] =g(1− g

M)( ∑

i∈mc

Nixi)2

1

g − 1

∑i∈mc

N2i (yi − R xi)2 +

g

M( ∑i∈mc

Nixi)2

∑i∈mc

N2i (

1

ni− 1

Ni

)s2y−R x,i

donde s2y−R x,i

= s2yi + R2s2

xi − 2Rsxyi.

El programa RACON2Z simula la extraccion de la muestra y calcula las estima-ciones anteriores. Sus parametros de entrada son,

1. Nombre del fichero conteniendo la poblacion.

2. Tamano de la muestra de conglomerados.

3. Fraccion del tamano del conglomerado que se tomara como tamano de muestradentro del mismo.

4. Nombre de la variable que define los conglomerados.

5. Nombre de la variable en el numerador, Y .

6. Nombre de la variable en el denominador, X.

La variable que define los conglomerados ha de cumplir las mismas especifica-ciones indicadas para el programa EMCON1Z y el tercer parametro tiene el mismosignificado que para el programa previo, EMCON2Z.

Este programa puede ser empleado tambien para estimar la media usando el es-timador basado en la razon, que resulta mas preciso cuando los tamanos de los con-glomerados son muy distintos. Para ello tomamos la variable del denominador comoX ≡ 1. Por ejemplo, para estimar la media de VIVIENDAS a partir de la extraccion,con muestreo aleatorio simple, de g = 3 conglomerados y posterior muestreo en losconglomerados usando muestreo aleatorio simple con tamano de muestra ni ≈ Ni/8,ejecutaremos la instruccion,

.DO RACON2Z WITH ’DCA757’,3,1/8,’PROV’,’VIVIENDAS’,’1’

Page 61: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

EL MUESTREO POR CONGLOMERADOS 58

obteniendo,

(RACON2Z)

==========================================================================

CONG.,Ni,ni,yi,xi,syi^2,sxi^2,sixy

==========================================================================

3 74 9 1554.556 1.000 3771679.778 0.000 0.000

1 102 12 1115.250 1.000 1517233.114 0.000 0.000

2 40 5 7365.800 1.000 63512352.200 0.000 0.000

===============================ESTIMACIONES===============================

RAZON ESTIMADA = 2423.26208848

VARIANZA ESTIMADA = 1394564.904762

INTERVALO AL 95% = 2423.26208848 +/- 2314.59727342

==========================================================================

Y -> VIVIENDAS X -> 1

siendo nulas las columnas correspondientes a s2xi y sxyi al ser constante la variable X.

Transparencia de apoyo: G-1. En esta transparencia se expresa la idea basica delmuestreo por conglomerados (en este caso en dos etapas), esto es, realizar un muestreoinicial sobre determinados agregados de elementos, como distritos, manzanas, etc,sobre los cuales se suele tener un acceso menos problematico. Posteriormente, encada uno de los agragados muestreados en la primera etapa, se realizaran nuevosmuestreos para obtener las unidades finales a interrogar o investigar.

Page 62: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Capıtulo 8

La funcion de dispersion sobre unapoblacion finita

En este capıtulo presentamos una nueva herramienta para el analisis de poblacio-nes finitas, en lo que se refiere a la dispersion de determinada variable. Esta herra-mienta es una adaptacion de la funcion de dispersion para una variable aleatoria, X,definida como D(t) = E[|X − t|]. Esta funcion ha sido ampliamente estudiada en laliteratura, vease por ejemplo Munoz (1990) y Munoz y Sanchez (1990).

Tomando como referencia el concepto anterior, se define en Mayor (1995) la funcionde dispersion de una variable Y , sobre una poblacion finita, U = {u1, u2, . . . , uN}, enla forma,

DY (t) =1

N

∑U

|Yi − t| ∀t ∈ R

Los autores citados han demostrado una serie de propiedades de la funcion dedispersion genericas, D(t), que se vuelven a reproducir en la version para poblacionfinita, siendo algunas de ellas,

Es continua en todo R y ademas es convexa por ser combinacion lineal, concoeficientes positivos, de funciones convexas del tipo |Yi − t|, luego solamentetiene mınimos globales en R.

Su grafica es una poligonal, rectilınea a trozos, siendo los puntos de separacionde los diferentes trozos los elementos del soporte, Y . Se tiene pues que es unafuncion derivable en R− Y , verificando ademas,

DY (t) = Y − t t ≤ Y(1)

59

Page 63: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

LA FUNCION DE DISPERSION EN POBLACIONES FINITAS 60

DY (t) = t− Y t ≥ Y(N)

donde Y(1) e Y(N) son, respectivamente, el menor y el mayor valor de la variableY .

DY (0) = Y , es decir, la ordenada en el origen coincide con la media poblacionalde la variable de estudio.

Entre la funcion de dispersion y la funcion de distribucion,

FY (t) =1

N#{ui|Yi ≤ t} t ∈ R

existe la siguiente relacion,

D′Y (t) = 2FY (t)− 1 t ∈ R− Y

Alcanza el mınimo en la mediana, M(Y ), o en todos los puntos del intervalomediano, IM(Y ), segun los casos.

Las propiedades anteriores indican que la grafica de la funcion de dispersion puederesultar muy ilustrativa para analizar globalmente una poblacion, y tambien pararealizar estudios comparativos entre varias poblaciones.

Por ejemplo, en la figura 8.1. podemos ver las graficas de las funciones de dispersionrelativas a la variable TURISMOS, en la poblacion DCA757, para las provincias:Cadiz, Granada y Malaga.

El analisis de las misma permite afirmar que, globalmente, la media de TURIS-MOS por localidad es mas elevada en Cadiz, siguiendole a gran distancia Malaga ydespues Granada. Tambien la dispersion de esta variable as mas elevada en Cadiz,aunque dicha dispersion va igualandose conforme aumenta el valor de la variable.

El lo que se refiere a la estimacion de la funcion de dispersion a partir de unamuestra, m, obtenida mediante un determinado diseno muestral, (M, p(·)), definidosobre U . Para un valor t ∈ R, podemos estimar DY (t) mediante el estimador deHorvitz-Thompson,

DY (t) =1

N

∑m

|Yi − t|πi

siendo esta estimacion insesgada para cualquier valor de t.

Page 64: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

LA FUNCION DE DISPERSION EN POBLACIONES FINITAS 61

Observemos que DY (t) sigue siendo una funcion convexa pero su valor mınimo yano tiene por que obtenerse en la mediana (o valores medianos) de las observacionesmuestrales, Yi, i ∈ m, a menos que el diseno sea uniforme en las probabilidades deinclusion de primer orden.

Con objeto de encontrar un diseno muestral apropiado para la estimacion de lafuncion de dispersion, vamos a considerar la varianza, suponiendo tamano muestralfijo, dada por la formula de Yates-Grundy-Sen (vease Fernandez y Mayor (1994)),

V [DY (t)] = − 1

2N2

∑i,j∈U

(πij − πiπj)(|Yi − t|πi

− |Yj − t|πj

)2

que depende de t y que para un diseno uniforme verificando πij ≤ πiπj, toma valormaximo si t ≥ Y(N) o t ≤ Y(1), siendo dicho maximo con πi = α, ∀i ∈ U ,

Vmax = − 1

2N2

∑i,j∈U

πij − α2

α2(Yi − Yj)2

lo que sugiere el uso de estrategias de muestreo que produzcan probabilidades deinclusion de segundo orden mayores para pares de elementos mas distantes.

Page 65: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

LA FUNCION DE DISPERSION EN POBLACIONES FINITAS 62

FIGURA 8.1. Funciones de dispersion de la variable TURISMOS para las provincias deCadiz, Malaga y Granada.

Page 66: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Apendice A. Datos de la poblacionDCA757

En este apendice hemos incluido un listado completo de la poblacion DCA757,aportando la informacion de cada una de las variables consideradas.

63

Page 67: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 64

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

1 4001 ABLA 1 680 1663 1582 277 127 1942 4002 ABRUCENA 1 645 1432 1427 206 62 893 4003 ADRA 1 7434 20104 20002 3693 977 27524 4004 ALBANCHEZ 1 609 682 616 146 41 1045 4005 ALBOLODUY 1 455 898 839 130 53 676 4006 ALBOX 1 3970 10010 9861 2994 541 12597 4007 ALCOLEA 1 347 824 824 121 44 818 4008 ALCONTAR 1 286 629 568 164 29 429 4009 ALCUDIA DE MONTEAGUDO 1 143 212 203 16 9 10

10 4010 ALHABIA 1 317 774 751 153 74 8411 4011 ALHAMA DE ALMERIA 1 1365 3050 2995 711 251 44212 4012 ALICUN 1 108 236 261 39 10 1913 4014 ALMOCITA 1 110 182 169 47 6 10314 4015 ALSODUX 1 89 125 117 20 7 10415 4016 ANTAS 1 1074 2514 2502 737 119 43216 4017 ARBOLEAS 1 870 1519 1473 380 58 9217 4018 ARMUNA DE ALMANZORA 1 180 376 303 67 18 2218 4019 BACARES 1 328 313 274 59 19 2319 4020 BAYARCAL 1 162 389 357 52 14 1920 4021 BAYARQUE 1 149 245 211 50 12 2321 4022 BEDAR 1 497 503 536 141 24 4222 4023 BEIRES 1 122 151 107 33 4 623 4024 BENAHADUX 1 1010 2277 2272 682 255 62024 4026 BENITAGLA 1 110 117 117 9 5 725 4027 BENIZALON 1 276 346 350 60 19 2626 4028 BENTARIQUE 1 174 365 321 51 15 1827 4029 BERJA 1 5619 12054 11966 2566 715 164328 4030 CANJAYAR 1 929 1826 1772 351 105 21329 4031 CANTORIA 1 1702 3309 3060 808 199 59630 4032 CARBONERAS 1 2596 5703 5732 1303 390 103531 4033 CASTRO DE FILABRES 1 149 167 167 25 7 3632 4034 COBDAR 1 223 283 240 57 13 1233 4035 CUEVAS DE ALMANZORA 1 4383 9167 9114 2552 477 174034 4036 CHERCOS 1 193 324 285 57 18 2035 4037 CHIRIVEL 1 1012 1995 1854 615 70 16336 4038 DALIAS 1 1376 3511 3439 1477 191 32237 4039 DARRICAL 1 169 417 418 9 6 438 4902 EJIDO, EL 1 15091 41374 41700 10838 2205 734339 4041 ENIX 1 318 241 244 88 19 3540 4043 FELIX 1 460 616 601 206 35 3841 24044 FINES 1 561 1621 1583 455 87 46742 4045 FINANA 1 1106 2563 2547 337 95 17843 4046 FONDON 1 586 906 845 165 48 7244 4047 GADOR 1 1018 2514 2474 522 138 39645 4048 GALLARDOS, LOS 1 740 1654 1619 427 63 16246 4049 GARRUCHA 1 2517 4382 4295 990 319 37647 4050 GERGAL 1 803 1095 1003 216 61 13148 4051 HUECIJA 1 235 558 544 114 39 8549 4052 HUERCAL DE ALMERIA 1 1521 3887 3891 1397 526 248350 4053 HUERCAL-OVERA 1 5409 13090 12815 3798 540 1114

Page 68: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 65

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

51 4054 ILLAR 1 237 504 472 88 25 2752 4055 INSTINCION 1 280 622 536 125 27 3853 4056 LAROYA 1 141 115 112 21 8 654 4057 LAUJAR DE ANDARAX 1 1027 1841 1780 303 135 19755 4058 LIJAR 1 343 535 531 122 34 4156 4059 LUBRIN 1 1536 2017 1951 348 115 14057 4060 LUCAINENA DE LAS TORRES 1 431 591 556 107 20 2158 4061 LUCAR 1 485 780 730 166 35 8159 4062 MACAEL 1 1994 5976 5961 1404 307 92560 4063 MARIA 1 895 1791 1791 471 66 11161 4064 MOJACAR 1 4683 3539 4305 1542 753 129662 4903 MOJONERA, LA 1 1767 5458 5448 1242 308 63863 4065 NACIMIENTO 1 453 490 496 99 24 4764 4066 NIJAR 1 6894 12554 12636 3470 755 218465 4067 OHANES 1 526 883 799 125 49 11066 4068 OLULA DE CASTRO 1 193 233 230 42 8 767 4069 OLULA DEL RIO 1 1976 5734 5695 1688 433 122968 4070 ORIA 1 1614 2454 2437 693 75 9769 4071 PADULES 1 290 528 428 81 31 6970 4072 PARTALOA 1 236 410 405 100 17 1771 4073 PATERNA DEL RIO 1 455 343 286 57 26 3572 4074 PECHINA 1 1266 2173 2166 536 87 22273 4075 PULPI 1 3152 4578 4574 1367 346 57174 4076 PURCHENA 1 753 1715 1651 390 130 41675 4077 RAGOL 1 216 428 420 72 15 4376 4078 RIOJA 1 541 1114 1098 241 83 11177 4079 ROQUETAS DE MAR 1 19554 26842 32361 10113 2384 406678 4080 SANTA CRUZ 1 119 151 154 31 11 1479 4081 SANTA FE DE MONDUJAR 1 284 423 428 88 29 8180 4082 SENES 1 173 360 306 68 15 1681 4083 SERON 1 1430 3012 2942 548 189 31082 4084 SIERRO 1 280 559 556 90 33 2683 4085 SOMONTIN 1 331 478 464 109 20 2484 4086 SORBAS 1 1655 2716 2707 605 149 27985 4087 SUFLI 1 140 257 250 47 17 4786 4088 TABERNAS 1 1852 3217 3227 771 173 34687 4089 TABERNO 1 434 1056 942 200 33 6088 4090 TAHAL 1 294 524 511 125 36 7089 4091 TERQUE 1 183 457 403 101 30 3590 4092 TIJOLA 1 1470 3642 3618 870 256 52591 4901 TRES VILLAS, LAS 1 542 710 603 117 38 4492 4093 TURRE 1 1180 2109 2112 566 155 26593 4094 TURRILLAS 1 154 290 290 64 10 2694 4095 ULEILA DEL CAMPO 1 560 1012 856 215 60 9495 4096 URRACAL 1 210 328 332 83 18 2096 4097 VELEFIQUE 1 302 370 382 76 14 1797 4098 VELEZ BLANCO 1 1504 2340 2251 555 118 16898 4099 VELEZ RUBIO 1 3261 6312 6037 1831 348 87599 4100 VERA 1 4012 5823 5931 1885 535 1219

100 4101 VIATOR 1 1085 2802 5646 721 189 6547

Page 69: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 66

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

101 4102 VICAR 1 4213 11885 11976 2748 558 1513102 4103 ZURGENA 1 1002 2102 2050 591 106 302103 11001 ALCALA DE LOS GAZULES 2 2672 5598 5592 915 272 739104 11002 ALCALA DEL VALLE 2 1442 5316 4324 670 178 441105 11003 ALGAR 2 618 1864 1846 327 76 115106 11004 ALGECIRAS 2 34218 101256 101556 29460 4700 16622107 11005 ALGODONALES 2 2346 5752 5376 832 239 434108 11006 ARCOS DE LA FRONTERA 2 8833 26946 26466 5712 948 2410109 11007 BARBATE DE FRANCO 2 8875 21641 21440 3341 1503 2787110 11008 BARRIOS, LOS 2 5343 13669 13901 3662 728 5191111 11009 BENAOCAZ 2 451 528 519 97 79 68112 11010 BORNOS 2 2510 7867 7179 1606 314 568113 11011 BOSQUE, EL 2 709 1777 1804 347 110 237114 11013 CASTELLAR DE LA FRONTERA 2 838 2269 2299 618 89 187115 11014 CONIL DE LA FRONTERA 2 7448 15582 15524 2965 837 1446116 11015 CHICLANA DE LA FRONTERA 2 22766 46862 46610 10875 2149 5529117 11016 CHIPIONA 2 11488 14297 14455 2490 1111 1795118 11017 ESPERA 2 1337 4113 3960 729 163 281119 11018 GASTOR, EL 2 790 2148 2079 386 81 122120 11019 GRAZALEMA 2 1322 2240 2325 441 122 231121 11021 JIMENA DE LA FRONTERA 2 3529 8862 8821 2300 445 996122 11022 LINEA DE LA CONCEPCION, LA 2 20062 58315 58646 15525 2652 6771123 11023 MEDINA-SIDONIA 2 5174 16309 15877 2852 721 1344124 11024 OLVERA 2 3228 9091 8702 1556 423 1120125 11025 PATERNA DE RIVERA 2 1591 4873 4590 834 197 308126 11026 PRADO DEL REY 2 2097 5539 5489 1090 487 764127 11027 PUERTO DE SANTA MARIA, EL 2 29329 65517 69663 19147 3778 12780128 11028 PUERTO REAL 2 9247 29638 29914 6482 1250 11780129 11029 PUERTO SERRANO 2 2091 6479 5757 794 183 452130 11030 ROTA 2 12708 22691 27139 18420 1313 4419131 11031 SAN FERNANDO 2 25144 85410 91696 20393 3138 21301132 11033 SAN ROQUE 2 10412 21224 23092 7196 1130 4134133 11032 SANLUCAR DE BARRAMEDA 2 18757 56006 57044 11132 2420 7238134 11034 SETENIL 2 1228 3194 2973 552 139 218135 11035 TARIFA 2 6064 14512 15528 2614 910 2025136 11036 TORRE-ALHAQUIME 2 447 1023 973 166 55 158137 11037 TREBUJENA 2 2147 6981 6868 1223 375 581138 11038 UBRIQUE 2 5697 18051 17669 3732 1178 3994139 11039 VEJER DE LA FRONTERA 2 4866 12793 12773 2698 649 1175140 11040 VILLALUENGA DEL ROSARIO 2 252 513 509 52 27 48141 11041 VILLAMARTIN 2 3770 12385 12100 2571 586 1257142 11042 ZAHARA 2 656 1610 1591 294 80 231143 14001 ADAMUZ 3 1720 4528 4344 925 189 610144 14002 AGUILAR 3 4079 13114 12830 2132 528 1222145 14003 ALCARACEJOS 3 865 1509 1507 382 113 197146 14004 ALMEDINILLA 3 1260 2591 2529 574 130 202147 14005 ALMODOVAR DEL RIO 3 2696 7076 6960 1722 407 872148 14006 ANORA 3 738 1651 1555 295 81 94149 14007 BAENA 3 6611 20423 20253 3416 833 2321150 14008 BELALCAZAR 3 2379 4143 3843 731 159 273

Page 70: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 67

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

151 14009 BELMEZ 3 1922 4348 4326 900 245 451152 14010 BENAMEJI 3 1391 4540 4517 812 253 566153 14011 BLAZQUEZ 3 454 745 737 178 54 50154 14012 BUJALANCE 3 3014 8487 8437 1713 423 785155 14013 CABRA 3 7627 20306 20343 4113 1177 3876156 14014 CANETE DE LAS TORRES 3 1280 3457 3395 637 250 477157 14015 CARCABUEY 3 1316 2945 2827 596 122 340158 14016 CARDENA 3 1233 2147 1988 402 129 218159 14017 CARLOTA, LA 3 3520 8982 8843 2383 479 815160 14018 CARPIO, EL 3 1546 4655 4519 981 251 731161 14019 CASTRO DEL RIO 3 2587 7963 7902 1445 402 876162 14020 CONQUISTA 3 407 546 489 115 37 38163 14022 DONA MENCIA 3 1551 5071 4985 644 196 479164 14023 DOS-TORRES 3 1150 2518 2496 417 108 251165 14024 ENCINAS REALES 3 884 2291 2224 478 88 279166 14025 ESPEJO 3 1483 5074 5027 706 212 336167 14026 ESPIEL 3 1499 2625 2575 492 160 602168 14027 FERNAN NUNEZ 3 3159 9320 9319 2007 517 1075169 14028 FUENTE LA LANCHA 3 245 490 463 67 21 26170 14029 FUENTE OBEJUNA 3 3016 6322 6055 1213 305 519171 14030 FUENTE PALMERA 3 3218 9371 9156 2396 488 836172 14031 FUENTE-TOJAR 3 444 903 853 169 53 61173 14032 GRANJUELA, LA 3 223 534 518 113 28 29174 14033 GUADALCAZAR 3 431 1145 1124 245 39 105175 14034 GUIJO 3 245 447 432 81 25 43176 14035 HINOJOSA DEL DUQUE 3 3571 8141 7942 1658 529 1167177 14036 HORNACHUELOS 3 2245 5086 4916 1142 250 403178 14037 IZNAJAR 3 2222 5752 5567 1371 251 413179 14038 LUCENA 3 10643 32173 32054 7240 2008 5650180 14039 LUQUE 3 1517 3375 3308 582 181 403181 14040 MONTALBAN DE CORDOBA 3 1587 4500 4497 756 245 431182 14041 MONTEMAYOR 3 1339 3701 3629 751 203 839183 14042 MONTILLA 3 8293 22403 21607 4755 1568 4176184 14043 MONTORO 3 4235 9681 9548 1734 525 1525185 14044 MONTURQUE 3 678 2005 1923 394 108 215186 14045 MORILES 3 1309 3660 3624 646 162 402187 14046 NUEVA-CARTEYA 3 1936 5735 5730 1012 238 368188 14047 OBEJO 3 718 1467 2996 324 112 644189 14048 PALENCIANA 3 624 1683 1618 231 79 114190 14049 PALMA DEL RIO 3 6781 18350 17978 4548 973 2421191 14050 PEDRO ABAD 3 1056 3001 2965 547 192 244192 14051 PEDROCHE 3 987 1899 1856 335 96 166193 14052 PENARROYA-PUEBLONUEVO 3 5731 14035 13946 3338 762 2825194 14053 POSADAS 3 2607 7099 7050 1778 405 847195 14054 POZOBLANCO 3 5897 15363 15445 3772 965 3338196 14055 PRIEGO DE CORDOBA 3 8202 21177 20823 4988 1144 2638197 14056 PUENTE-GENIL 3 9897 26387 25969 6349 1431 3499198 14057 RAMBLA, LA 3 2194 6865 6803 1185 546 1347199 14058 RUTE 3 4046 10072 9703 2473 578 1204200 14059 S.SEBASTIAN BALLESTEROS 3 292 827 833 199 62 42

Page 71: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 68

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

201 14061 SANTA EUFEMIA 3 690 1259 1163 170 61 72202 14060 SANTAELLA 3 1995 5728 5626 1425 294 493203 14062 TORRECAMPO 3 919 1571 1470 287 96 118204 14063 VALENZUELA 3 873 1567 1489 306 77 125205 14064 VALSEQUILLO 3 374 556 502 90 43 60206 14065 VICTORIA, LA 3 656 1721 1718 408 93 416207 14066 VILLA DEL RIO 3 2220 7021 6964 1247 422 888208 14067 VILLAFRANCA DE CORDOBA 3 1120 3594 3515 807 242 527209 14068 VILLAHARTA 3 401 656 755 136 50 49210 14069 VILLANUEVA DE CORDOBA 3 4313 10402 9534 2442 587 1477211 14070 VILLANUEVA DEL DUQUE 3 1112 2063 1958 316 133 158212 14071 VILLANUEVA DEL REY 3 821 1317 1237 201 54 137213 14072 VILLARALTO 3 938 1761 1705 260 64 96214 14073 VILLAVICIOSA DE CORDOBA 3 1966 3981 3843 703 294 353215 14074 VISO, EL 3 1680 3439 3216 582 146 185216 14075 ZUHEROS 3 447 958 942 125 51 90217 18001 AGRON 4 202 445 429 80 16 19218 18002 ALAMEDILLA 4 436 1045 900 199 31 56219 18003 ALBOLOTE 4 4116 10184 10070 2798 595 2327220 18004 ALBONDON 4 975 1358 1317 255 75 134221 18005 ALBUNAN 4 310 491 496 111 18 23222 18006 ALBUNOL 4 2623 5336 5311 980 241 518223 18007 ALBUNUELAS 4 801 1367 1328 192 53 111224 18010 ALDEIRE 4 582 790 733 123 27 44225 18011 ALFACAR 4 1604 3576 3701 1055 176 328226 18012 ALGARINEJO 4 2014 5276 5096 910 142 180227 18013 ALHAMA DE GRANADA 4 2531 6023 5783 1111 312 754228 18014 ALHENDIN 4 1428 3674 4383 946 148 933229 18015 ALICUN DE ORTEGA 4 295 795 646 87 21 39230 18016 ALMEGIJAR 4 361 460 406 75 21 21231 18017 ALMUNECAR 4 20796 20408 20461 5177 2026 2722232 18904 ALPUJARRA DE LA SIERRA 4 741 1320 1159 103 53 86233 18018 ALQUIFE 4 433 1150 1127 376 42 455234 18020 ARENAS DEL REY 4 1047 2065 1997 460 76 124235 18021 ARMILLA 4 3695 10921 10990 3225 708 2285236 18022 ATARFE 4 3704 10008 10045 2605 688 2304237 18023 BAZA 4 7225 20519 19997 4847 1060 2440238 18024 BEAS DE GRANADA 4 380 894 886 184 28 48239 18025 BEAS DE GUADIX 4 158 416 357 77 12 18240 18027 BENALUA DE GUADIX 4 1133 3441 3067 595 165 341241 18028 BENALUA DE LAS VILLAS 4 621 1392 1330 293 50 77242 18029 BENAMAUREL 4 994 2496 2361 530 92 169243 18030 BERCHULES 4 762 881 864 83 63 84244 18032 BUBION 4 328 345 303 62 32 60245 18033 BUSQUISTAR 4 292 457 457 68 19 22246 18034 CACIN 4 509 882 869 219 25 41247 18035 CADIAR 4 861 2057 2018 334 101 167248 18036 CAJAR 4 832 2222 2201 625 41 160249 18114 CALAHORRA, LA 4 528 995 954 200 51 77250 18037 CALICASAS 4 223 598 589 177 12 20

Page 72: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 69

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

251 18038 CAMPOTEJAR 4 671 1450 1411 330 68 128252 18039 CANILES 4 2227 5181 4987 1199 186 354253 18040 CANAR 4 239 346 297 30 12 14254 18042 CAPILEIRA 4 462 577 576 84 43 63255 18043 CARATAUNAS 4 146 215 168 38 8 10256 18044 CASTARAS 4 243 340 333 55 10 16257 18045 CASTILLEJAR 4 875 2248 1985 364 86 100258 18046 CASTRIL 4 1582 3247 3074 651 115 238259 18047 CENES DE LA VEGA 4 930 2385 2384 617 95 125260 18048 CIJUELA 4 563 1295 1245 315 55 94261 18049 COGOLLOS DE GUADIX 4 480 774 746 133 28 56262 18050 COGOLLOS VEGA 4 800 1939 2134 375 57 278263 18051 COLOMERA 4 855 1865 1675 435 83 107264 18053 CORTES DE BAZA 4 1200 3039 2495 504 103 151265 18054 CORTES Y GRAENA 4 378 1005 929 210 69 65266 18912 CUEVAS DEL CAMPO 4 928 2303 2187 543 79 116267 18056 CULLAR 4 2284 5457 5035 1041 311 446268 18057 CULLAR-VEGA 4 770 1732 1712 509 64 108269 18059 CHAUCHINA 4 1413 3720 3711 884 125 328270 18061 CHIMENEAS 4 760 1528 1513 325 55 113271 18062 CHURRIANA DE LA VEGA 4 2005 5536 5549 1458 344 930272 18063 DARRO 4 604 1575 1554 373 37 94273 18064 DEHESAS DE GUADIX 4 213 663 546 80 23 31274 18066 DEIFONTES 4 912 2385 2326 519 69 106275 18067 DIEZMA 4 583 1065 1005 210 62 157276 18068 DILAR 4 657 1431 1324 306 51 82277 18069 DOLAR 4 406 731 731 133 34 44278 18070 DUDAR 4 139 252 253 64 8 9279 18071 DURCAL 4 2301 5804 5822 1108 328 910280 18072 ESCUZAR 4 422 968 930 222 30 60281 18074 FERREIRA 4 246 424 375 63 18 17282 18076 FONELAS 4 478 1405 1175 314 41 113283 18078 FREILA 4 503 1282 1112 267 49 64284 18079 FUENTE VAQUEROS 4 1397 3826 3753 813 123 221285 18905 GABIAS, LAS 4 2492 6062 5956 1515 213 530286 18082 GALERA 4 832 1660 1569 347 59 98287 18083 GOBERNADOR 4 155 413 249 98 16 14288 18084 GOJAR 4 1323 2353 2349 692 64 117289 18085 GOR 4 985 1302 1052 275 78 91290 18086 GORAFE 4 297 626 575 122 25 34291 18088 GUADAHORTUNA 4 914 2400 2282 537 118 175292 18089 GUADIX 4 7185 20033 19634 4348 1230 2534293 18906 GUAJARES, LOS 4 840 1525 1520 166 57 80294 18093 GUALCHOS 4 1632 2984 2914 504 107 194295 18094 GUEJAR-SIERRA 4 1151 2610 2707 437 110 294296 18095 GUEVEJAR 4 453 1255 1245 298 23 65297 18096 HUELAGO 4 277 675 691 99 31 48298 18097 HUENEJA 4 813 1410 1387 311 63 111299 18098 HUESCAR 4 3888 10031 9360 1950 450 1047300 18099 HUETOR-SANTILLAN 4 838 1527 1527 444 78 154

Page 73: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 70

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

301 18100 HUETOR-TAJAR 4 3117 7502 7342 1594 320 588302 18101 HUETOR-VEGA 4 2476 6505 6658 1908 167 657303 18102 ILLORA 4 4280 10389 10165 2287 324 741304 18103 ITRABO 4 515 1109 1032 136 33 45305 18105 IZNALLOZ 4 2806 6534 6422 1367 242 593306 18107 JAYENA 4 621 1498 1449 274 40 80307 18108 JEREZ DEL MARQUESADO 4 1060 1217 1122 186 73 112308 18109 JETE 4 273 728 717 131 34 73309 18111 JUN 4 394 1047 1054 318 64 366310 18112 JUVILES 4 105 213 213 41 7 10311 18115 LACHAR 4 744 2258 2090 629 94 253312 18116 LANJARON 4 2052 3972 3954 745 315 628313 18117 LANTEIRA 4 456 715 684 164 24 84314 18119 LECRIN 4 1200 2391 2275 531 96 192315 18120 LENTEJI 4 189 383 364 54 9 12316 18121 LOBRAS 4 198 222 184 49 8 9317 18122 LOJA 4 7351 20768 20321 4627 945 3064318 18123 LUGROS 4 259 486 411 80 17 21319 18124 LUJAR 4 372 623 620 108 20 40320 18126 MALAHA, LA 4 591 1619 1596 388 62 77321 18127 MARACENA 4 4560 12956 12972 3930 636 1774322 18128 MARCHAL 4 179 465 396 101 15 15323 18132 MOCLIN 4 1993 4744 4537 1024 136 203324 18133 MOLVIZAR 4 1081 2478 2364 392 97 218325 18134 MONACHIL 4 3261 4218 6604 1275 256 380326 18135 MONTEFRIO 4 3522 8183 7885 1694 236 942327 18136 MONTEJICAR 4 1094 3012 2889 507 109 228328 18137 MONTILLANA 4 674 1361 1183 222 61 95329 18138 MORALEDA DE ZAFAYONA 4 930 2573 2545 580 93 258330 18909 MORELABOR 4 481 1053 1053 179 57 83331 18140 MOTRIL 4 22440 46500 45880 11281 2781 7638332 18141 MURTAS 4 443 1164 1096 173 45 2094333 18903 NEVADA 4 889 1515 1255 148 60 87334 18143 NIGUELAS 4 546 1191 1167 227 47 98335 18144 NIVAR 4 273 563 562 145 10 27336 18145 OGIJARES 4 2453 5097 5062 1521 220 811337 18146 ORCE 4 660 1536 1412 320 79 140338 18147 ORGIVA 4 2305 5100 4994 1091 299 634339 18148 OTIVAR 4 501 1161 1083 211 57 162340 18149 OTURA 4 1414 2615 2547 651 99 264341 18150 PADUL 4 2498 6133 6015 1357 236 596342 18151 PAMPANEIRA 4 353 326 316 61 30 50343 18152 PEDRO-MARTINEZ 4 811 1574 1572 402 56 94344 18153 PELIGROS 4 2283 6269 6094 1938 490 2246345 18154 PEZA, LA 4 795 1579 1453 258 54 103346 18910 PINAR, EL 4 587 1296 1275 170 37 48347 18157 PINOS-GENIL 4 429 1085 1069 247 40 78348 18158 PINOS-PUENTE 4 5074 13132 12995 3153 430 1112349 18159 PINAR 4 691 1505 1505 233 61 96350 18161 POLICAR 4 152 258 194 64 10 14

Page 74: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 71

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

351 18162 POLOPOS 4 806 1210 1182 214 84 123352 18163 PORTUGOS 4 245 457 457 82 16 25353 18164 PUEBLA DE DON FADRIQUE 4 1493 2597 2419 685 112 213354 18165 PULIANAS 4 868 2549 2502 700 103 387355 18167 PURULLENA 4 886 2514 2423 600 133 238356 18168 QUENTAR 4 477 1060 1048 183 29 40357 18170 RUBITE 4 304 436 417 86 15 24358 18171 SALAR 4 1212 2799 2716 477 97 222359 18173 SALOBRENA 4 6823 9474 9220 1968 715 925360 18174 SANTA CRUZ DEL COMERCIO 4 331 596 657 127 27 65361 18175 SANTA FE 4 4013 12000 11645 2663 559 1458362 18176 SOPORTUJAR 4 172 266 206 36 9 10363 18177 SORVILAN 4 583 952 940 118 29 59364 18901 TAHA, LA 4 633 956 956 165 49 97365 18178 TORRE-CARDELA 4 602 1220 995 227 70 100366 18179 TORVIZCON 4 607 1172 1169 184 41 63367 18180 TREVELEZ 4 496 823 823 82 62 125368 18181 TURON 4 237 458 458 63 14 14369 18182 UGIJAR 4 1381 3014 3035 403 205 411370 18183 VALOR 4 569 1126 1019 167 50 111371 18902 VALLE, EL 4 740 1533 1412 264 40 54372 18907 VALLE DE ZALABI 4 1152 2473 2473 383 140 283373 18911 VEGAS DEL GENIL 4 1104 2607 2559 748 86 164374 18184 VELEZ DE BENAUDALLA 4 1129 2478 2436 412 104 206375 18185 VENTAS DE HUELMA 4 339 680 645 160 32 54376 18908 VILLAMENA 4 423 972 941 175 32 49377 18187 VILLANUEVA DE LAS TORRES 4 370 1073 1073 146 34 48378 18188 VILLANUEVA MESIA 4 705 1911 1885 339 93 311379 18189 VIZNAR 4 350 781 812 201 33 47380 18192 ZAFARRAYA 4 906 2205 2194 581 87 145381 18913 ZAGRA 4 520 1212 1158 162 44 143382 18193 ZUBIA, LA 4 3545 8746 8741 2514 484 763383 18194 ZUJAR 4 1255 2986 2789 578 94 247384 21001 ALAJAR 5 516 836 824 128 39 46385 21002 ALJARAQUE 5 2639 6753 6720 1697 240 372386 21003 ALMENDRO, EL 5 479 844 839 101 57 88387 21004 ALMONASTER LA REAL 5 1376 2109 2064 387 111 166388 21005 ALMONTE 5 16096 16164 16350 3038 1356 2518389 21006 ALOSNO 5 1834 4777 4567 798 145 309390 21007 ARACENA 5 2656 6503 6739 1586 475 1304391 21008 AROCHE 5 1684 3593 3558 394 122 210392 21009 ARROYOMOLINOS DE LEON 5 682 1242 1240 190 61 84393 21010 AYAMONTE 5 6491 15082 14937 2978 1188 2704394 21011 BEAS 5 2387 4072 3861 953 196 217395 21012 BERROCAL 5 239 422 386 79 19 36396 21013 BOLLULLOS PAR DEL CONDADO 5 3895 12575 12465 2408 632 1410397 21014 BONARES 5 1907 4949 4900 974 196 490398 21015 CABEZAS RUBIAS 5 437 969 906 171 34 46399 21016 CALA 5 654 1484 1490 328 145 321400 21017 CALANAS 5 2502 5093 4936 834 303 978

Page 75: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 72

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

401 21018 CAMPILLO, EL 5 1122 2651 2717 586 137 255402 21019 CAMPOFRIO 5 439 908 899 203 57 53403 21020 CANAVERAL DE LEON 5 290 586 548 81 25 34404 21021 CARTAYA 5 5658 10357 10438 2291 572 1109405 21022 CASTANO DEL ROBLEDO 5 214 195 186 37 42 22406 21023 CERRO DE ANDEVALO, EL 5 1269 2864 2848 399 135 189407 21024 CORTECONCEPCION 5 382 702 666 127 41 72408 21025 CORTEGANA 5 2259 5243 5225 955 324 778409 21026 CORTELAZOR 5 212 314 319 49 19 21410 21027 CUMBRES DE EN MEDIO 5 61 58 73 10 10 6411 21028 CUMBRES DE SAN BARTOLOME 5 343 668 636 82 33 42412 21029 CUMBRES MAYORES 5 1055 2230 2184 367 150 277413 21030 CHUCENA 5 658 1924 1924 326 64 586414 21031 ENCINASOLA 5 1276 2068 2048 268 129 101415 21032 ESCACENA DEL CAMPO 5 751 2220 2202 416 104 202416 21033 FUENTEHERIDOS 5 425 650 639 133 53 86417 21034 GALAROZA 5 954 1603 1538 316 94 140418 21035 GIBRALEON 5 4084 10018 9934 2007 355 899419 21036 GRANADA DE RIO-TINTO, LA 5 118 229 230 26 13 12420 21037 GRANADO, EL 5 326 696 645 111 31 41421 21038 HIGUERA DE LA SIERRA 5 684 1330 1296 253 109 275422 21039 HINOJALES 5 315 463 463 82 19 24423 21040 HINOJOS 5 1132 3445 3434 720 88 194424 21042 ISLA-CRISTINA 5 7069 16524 16575 2662 1178 2133425 21043 JABUGO 5 1135 2510 2525 515 155 640426 21044 LEPE 5 9336 16565 16562 3091 845 1791427 21045 LINARES DE LA SIERRA 5 263 283 278 43 20 16428 21046 LUCENA DEL PUERTO 5 702 2054 2049 373 63 159429 21047 MANZANILLA 5 927 2562 2541 388 104 228430 21048 MARINES, LOS 5 204 352 354 88 12 61431 21049 MINAS DE RIOTINTO 5 2222 5480 5374 1556 184 1488432 21050 MOGUER 5 6590 11905 12193 2740 656 1396433 21051 NAVA, LA 5 205 350 335 65 23 26434 21052 NERVA 5 2898 6962 6845 1539 358 865435 21053 NIEBLA 5 1526 3822 3832 892 137 573436 21054 PALMA DEL CONDADO, LA 5 3012 9429 9331 1902 663 1930437 21055 PALOS DE LA FRONTERA 5 3030 6750 7335 1888 448 4294438 21056 PATERNA DEL CAMPO 5 1435 3848 3818 653 152 283439 21057 PAYMOGO 5 669 1399 1319 162 60 97440 21058 PUEBLA DE GUZMAN 5 1368 3202 3172 534 65 108441 21059 PUERTO-MORAL 5 116 236 221 47 15 16442 21060 PUNTA UMBRIA 5 11456 10031 9897 1827 746 1120443 21061 ROCIANA DEL CONDADO 5 2004 6121 6095 1204 479 476444 21062 ROSAL DE LA FRONTERA 5 933 1946 1934 350 133 198445 21063 SAN BARTOLOME DE LA TORRE 5 1030 2877 2870 589 128 211446 21064 SAN JUAN DEL PUERTO 5 1930 5732 5738 1454 253 809447 21066 SAN SILVESTRE DE GUZMAN 5 338 699 676 106 45 68448 21065 SANLUCAR DE GUADIANA 5 265 409 399 56 22 34449 21067 SANTA ANA LA REAL 5 336 505 479 107 19 24450 21068 SANTA BARBARA DE CASA 5 662 1444 1441 207 66 91

Page 76: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 73

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

451 21069 SANTA OLALLA DEL CALA 5 1059 2342 2325 385 134 275452 21070 TRIGUEROS 5 2722 7044 7016 1711 383 804453 21071 VALDELARCO 5 232 297 293 49 20 17454 21072 VALVERDE DEL CAMINO 5 5187 12341 12372 3184 724 1875455 21073 VILLABLANCA 5 770 2029 2028 372 113 174456 21074 VILLALBA DEL ALCOR 5 1169 3674 3489 546 133 276457 21075 VILLANUEVA DE LAS CRUCES 5 234 431 388 67 33 44458 21076 V.NVA DE LOS CASTILLEJOS 5 1258 2613 2461 566 167 234459 21077 VILLARRASA 5 768 2182 2196 341 91 151460 21078 ZALAMEA LA REAL 5 1836 3768 3726 898 212 317461 21079 ZUFRE 5 722 1322 1182 175 68 74462 23001 ALBANCHEZ DE UBEDA 6 888 1664 1527 223 50 89463 23002 ALCALA LA REAL 6 9051 21090 20231 4699 1195 2731464 23003 ALCAUDETE 6 5272 11460 11154 2220 628 1504465 23004 ALDEAQUEMADA 6 431 576 509 101 38 52466 23005 ANDUJAR 6 14747 36661 35803 8607 1981 5386467 23006 ARJONA 6 2185 5492 5311 1053 283 581468 23007 ARJONILLA 6 1594 3960 3732 648 234 455469 23008 ARQUILLOS 6 848 1703 1649 379 81 173470 23009 BAEZA 6 6112 15064 17691 3121 746 2843471 23010 BAILEN 6 5645 16865 16814 3324 852 2451472 23011 BANOS DE LA ENCINA 6 1533 2740 2733 435 95 226473 23012 BEAS DE SEGURA 6 4103 8261 8275 1853 501 951474 23902 BEDMAR Y GARCIEZ 6 1593 3480 3179 497 116 180475 23014 BEGIJAR 6 1354 3091 2996 580 123 243476 23015 BELMEZ DE LA MORALEDA 6 877 2031 1879 372 114 377477 23016 BENATAE 6 384 608 547 84 39 48478 23017 CABRA DE SANTO CRISTO 6 999 2311 2094 363 87 222479 23018 CAMBIL 6 1482 3536 3214 462 118 196480 23019 CAMPILLO DE ARENAS 6 987 2279 2245 274 110 224481 23020 CANENA 6 825 2063 1937 355 114 448482 23021 CARBONEROS 6 313 715 715 112 34 66483 23901 CARCHELES 6 813 1622 1454 246 65 141484 23024 CAROLINA, LA 6 5629 15071 14759 3213 627 3048485 23025 CASTELLAR DE SANTISTEBAN 6 1620 3675 3621 634 151 292486 23026 CASTILLO DE LOCUBIN 6 2942 5722 5544 1076 277 458487 23027 CAZALILLA 6 333 883 795 144 35 44488 23028 CAZORLA 6 3909 9046 8885 1770 537 974489 23029 CHICLANA DE SEGURA 6 809 1687 1644 219 45 68490 23030 CHILLUEVAR 6 773 1956 1788 275 71 142491 23031 ESCANUELA 6 447 1033 1014 171 49 82492 23032 ESPELUY 6 265 809 789 157 46 124493 23033 FRAILES 6 946 1896 1869 334 81 167494 23034 FUENSANTA DE MARTOS 6 1780 3406 3276 597 166 305495 23035 FUERTE DEL REY 6 620 1179 1178 222 40 71496 23037 GENAVE 6 407 812 752 132 40 73497 23038 GUARDIA DE JAEN, LA 6 1127 1794 1744 326 86 240498 23039 GUARROMAN 6 1071 2891 2890 454 131 567499 23040 HIGUERA DE ARJONA 6 732 1928 1844 289 108 227500 23041 HIGUERA DE CALATRAVA 6 282 725 673 164 36 52

Page 77: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 74

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

501 23042 HINOJARES 6 264 617 549 113 15 17502 23043 HORNOS 6 481 800 729 142 74 98503 23044 HUELMA 6 2423 5942 5566 1193 312 759504 23045 HUESA 6 1037 2606 2621 421 89 167505 23046 IBROS 6 1213 3121 3037 582 121 306506 23047 IRUELA, LA 6 1023 2101 2186 381 92 131507 23048 IZNATORAF 6 707 1266 1254 194 45 82508 23049 JABALQUINTO 6 982 2540 2495 422 56 91509 23051 JAMILENA 6 1264 3115 2976 501 208 407510 23052 JIMENA 6 810 1669 1546 258 89 110511 23053 JODAR 6 4522 11775 11201 1591 447 1586512 23054 LARVA 6 318 601 572 47 34 32513 23055 LINARES 6 21145 59249 58417 14912 3026 14210514 23056 LOPERA 6 1414 3948 3836 761 191 317515 23057 LUPION 6 473 1157 1084 236 49 73516 23058 MANCHA REAL 6 3451 8415 8409 1848 495 1510517 23059 MARMOLEJO 6 2563 7313 7239 1132 324 1115518 23060 MARTOS 6 8662 20945 20630 4562 1025 3425519 23061 MENGIBAR 6 2993 8099 8088 1685 380 1213520 23062 MONTIZON 6 933 2007 1944 354 70 97521 23063 NAVAS DE SAN JUAN 6 2093 5388 4958 753 255 475522 23064 NOALEJO 6 1182 2392 2441 235 72 139523 23065 ORCERA 6 1204 2417 2266 421 131 276524 23066 PEAL DE BECERRO 6 2476 5357 5152 1091 279 497525 23067 PEGALAJAR 6 1444 3054 2987 508 136 264526 23069 PORCUNA 6 3043 7031 6731 1162 388 749527 23070 POZO ALCON 6 2859 6066 5447 1157 345 644528 23071 PUENTE DE GENAVE 6 1004 2064 1900 426 95 194529 23072 PUERTA DE SEGURA, LA 6 1486 2872 2807 581 169 396530 23073 QUESADA 6 3203 6564 6085 1188 302 715531 23074 RUS 6 1340 3694 3542 589 155 372532 23075 SABIOTE 6 1858 4303 4158 758 198 318533 23076 SANTA ELENA 6 542 1087 1076 207 70 119534 23077 SANTIAGO DE CALATRAVA 6 537 1005 963 173 47 60535 23904 SANTIAGO-PONTONES 6 2522 5075 4687 606 179 319536 23079 SANTISTEBAN DEL PUERTO 6 2144 5019 4639 793 226 400537 23080 SANTO TOME 6 1304 2619 2505 447 172 232538 23081 SEGURA DE LA SIERRA 6 1221 2319 2159 472 148 419539 23082 SILES 6 1339 2944 2756 546 112 366540 23084 SORIHUELA DEL GUADALIMAR 6 730 1404 1320 265 64 109541 23086 TORRE DEL CAMPO 6 4371 11301 11144 1919 131 212542 23085 TORREBLASCOPEDRO 6 1251 3021 2863 579 514 1225543 23087 TORREDONJIMENO 6 5006 13401 13003 3179 695 1985544 23088 TORREPEROGIL 6 3007 7580 7355 1595 325 806545 23090 TORRES 6 1158 1940 1854 320 75 155546 23091 TORRES DE ALBANCHEZ 6 584 1126 1080 196 44 91547 23092 UBEDA 6 11839 30538 31962 8272 1804 6264548 23093 VALDEPENAS DE JAEN 6 2088 4568 4436 612 188 284549 23094 VILCHES 6 2111 5055 4953 921 188 398550 23095 VILLACARRILLO 6 4892 11672 10925 1971 864 1341

Page 78: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 75

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

551 23096 VILLANUEVA DE LA REINA 6 1497 3420 3194 570 174 419552 23097 VILLANUEVA DEL ARZOBISPO 6 3703 8555 8401 1960 470 1184553 23098 VILLARDOMPARDO 6 577 1278 1260 192 55 113554 23099 VILLARES, LOS 6 2318 4547 4489 516 207 353555 23101 VILLARRODRIGO 6 407 737 667 131 44 58556 23903 VILLATORRES 6 1691 3889 3781 667 142 262557 29001 ALAMEDA 7 1472 4804 4762 804 258 581558 29002 ALCAUCIN 7 1006 1391 1383 221 75 122559 29003 ALFARNATE 7 683 1525 1463 222 64 176560 29004 ALFARNATEJO 7 213 435 442 79 24 37561 29005 ALGARROBO 7 3782 4528 4473 842 249 456562 29006 ALGATOCIN 7 500 1019 1004 150 61 137563 29007 ALHAURIN DE LA TORRE 7 5635 12874 13106 3872 538 1330564 29008 ALHAURIN EL GRANDE 7 7432 17257 17197 3398 809 2015565 29009 ALMACHAR 7 1037 2010 1992 303 61 100566 29010 ALMARGEN 7 896 2239 2177 457 140 187567 29011 ALMOGIA 7 1609 3862 4333 635 135 354568 29012 ALORA 7 5178 13168 12740 2086 609 1204569 29013 ALOZAINA 7 1047 2579 2185 337 89 246570 29014 ALPANDEIRE 7 249 337 313 46 14 16571 29015 ANTEQUERA 7 13604 38765 38827 9450 1996 6640572 29016 ARCHEZ 7 307 333 329 39 27 55573 29017 ARCHIDONA 7 3394 10204 10114 1849 467 1231574 29018 ARDALES 7 1101 3201 3104 327 104 193575 29019 ARENAS 7 738 1265 1265 160 44 69576 29020 ARRIATE 7 1166 3301 3298 607 124 257577 29021 ATAJATE 7 104 164 165 23 14 72578 29022 BENADALID 7 204 255 227 53 15 17579 29023 BENAHAVIS 7 1802 1333 1433 354 131 273580 29024 BENALAURIA 7 262 526 581 78 20 27581 29025 BENALMADENA 7 24800 21994 25747 9328 3206 6767582 29026 BENAMARGOSA 7 760 1654 1640 292 65 138583 29027 BENAMOCARRA 7 927 2789 2744 412 85 156584 29028 BENAOJAN 7 804 1642 1593 310 122 328585 29029 BENARRABA 7 330 709 615 99 30 42586 29030 BORGE, EL 7 640 1066 980 145 56 166587 29031 BURGO, EL 7 910 2117 2042 273 106 224588 29032 CAMPILLOS 7 2560 7551 7589 1546 433 1300589 29033 CANILLAS DE ACEITUNO 7 1603 2793 2747 251 126 118590 29034 CANILLAS DE ALBAIDA 7 594 637 636 60 35 70591 29035 CANETE LA REAL 7 1130 2341 2023 296 125 208592 29036 CARRATRACA 7 418 819 856 136 40 52593 29037 CARTAJIMA 7 197 358 324 53 21 28594 29038 CARTAMA 7 3690 11054 11017 2830 531 1247595 29039 CASABERMEJA 7 1268 3098 3076 648 131 216596 29040 CASARABONELA 7 1211 2554 2494 375 103 270597 29041 CASARES 7 2822 3286 3309 529 191 304598 29042 COIN 7 7146 14855 14731 3677 770 2197599 29043 COLMENAR 7 1385 3173 3160 652 135 301600 29044 COMARES 7 819 1460 1379 244 70 97

Page 79: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 76

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

601 29045 COMPETA 7 1626 2468 2515 514 144 489602 29046 CORTES DE LA FRONTERA 7 1803 3747 3740 533 146 181603 29047 CUEVAS BAJAS 7 589 1550 1536 249 91 216604 29049 CUEVAS DE SAN MARCOS 7 1597 4081 3924 612 163 342605 29048 CUEVAS DEL BECERRO 7 803 2018 1733 200 94 134606 29050 CUTAR 7 458 613 614 84 27 38607 29051 ESTEPONA 7 25629 34965 36307 10192 3266 6544608 29052 FARAJAN 7 188 314 309 56 22 27609 29053 FRIGILIANA 7 1739 2169 2125 430 135 243610 29054 FUENGIROLA 7 30920 37742 43048 16912 4740 9987611 29055 FUENTE DE PIEDRA 7 714 1931 1969 473 120 249612 29056 GAUCIN 7 1185 1830 1653 393 84 206613 29057 GENALGUACIL 7 369 662 584 68 34 52614 29058 GUARO 7 890 2009 1706 418 86 139615 29059 HUMILLADERO 7 845 2338 2328 547 98 158616 29060 IGUALEJA 7 495 1055 1040 142 48 143617 29061 ISTAN 7 686 1322 1346 271 65 65618 29062 IZNATE 7 259 743 745 91 19 41619 29063 JIMERA DE LIBAR 7 373 482 423 188 32 48620 29064 JUBRIQUE 7 416 908 861 116 49 61621 29065 JUZCAR 7 146 252 259 53 17 20622 29066 MACHARAVIAYA 7 147 349 357 82 17 19623 29068 MANILVA 7 5274 4824 4902 1499 487 720624 29069 MARBELLA 7 49362 80599 84410 31393 8112 17861625 29070 MIJAS 7 25538 31680 32835 9679 1888 3222626 29071 MOCLINEJO 7 372 1075 1044 171 29 111627 29072 MOLLINA 7 1142 3089 3067 722 109 301628 29073 MONDA 7 864 1672 1664 348 85 152629 29074 MONTEJAQUE 7 600 1047 969 198 75 127630 29075 NERJA 7 12281 13604 14334 4073 1364 2848631 29076 OJEN 7 987 1995 1976 441 99 249632 29077 PARAUTA 7 238 303 260 43 22 16633 29079 PERIANA 7 1703 3374 3362 547 138 265634 29080 PIZARRA 7 2396 6426 6447 1355 333 833635 29081 PUJERRA 7 168 355 317 65 31 59636 29082 RINCON DE LA VICTORIA 7 12671 12601 13007 3766 698 1459637 29083 RIOGORDO 7 1377 2537 2416 419 146 304638 29084 RONDA 7 13331 33900 35788 9174 1946 7702639 29085 SALARES 7 220 238 230 15 12 15640 29086 SAYALONGA 7 526 1062 1037 158 44 60641 29087 SEDELLA 7 438 470 466 77 24 28642 29088 SIERRA DE YEGUAS 7 1142 3165 3105 671 178 414643 29089 TEBA 7 1609 4387 4362 684 230 684644 29090 TOLOX 7 1178 3108 2931 301 114 229645 29901 TORREMOLINOS 7 28119 27543 35309 14731 4781 11003646 29091 TORROX 7 10200 10519 10539 2008 707 1361647 29092 TOTALAN 7 268 605 594 79 32 47648 29093 VALLE DE ABDALAJIS 7 1005 2999 2887 460 115 275649 29094 VELEZ-MALAGA 7 29319 50999 52150 12463 3763 6976650 29095 VILLANUEVA DE ALGAIDAS 7 1590 4256 4178 1036 172 411

Page 80: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 77

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

651 29098 VILLANUEVA DE TAPIA 7 644 1575 1521 367 111 178652 29096 VILLANUEVA DEL ROSARIO 7 1243 3177 3144 649 100 186653 29097 VILLANUEVA DEL TRABUCO 7 1650 4365 4342 1053 187 243654 29099 VINUELA 7 617 1154 1149 229 46 113655 29100 YUNQUERA 7 1349 3159 3146 387 153 518656 41001 AGUADULCE 8 776 1918 1922 369 97 199657 41002 ALANIS 8 933 2125 2076 404 80 121658 41003 ALBAIDA DEL ALJARAFE 8 507 1670 1672 342 35 51659 41004 ALCALA DE GUADAIRA 8 17430 52257 52515 14180 2233 14910660 41005 ALCALA DEL RIO 8 2942 9039 9135 2110 351 1314661 41006 ALCOLEA DEL RIO 8 1076 3386 3253 551 129 210662 41007 ALGABA, LA 8 4042 12294 12298 2241 470 841663 41008 ALGAMITAS 8 517 1416 1419 171 61 102664 41009 ALMADEN DE LA PLATA 8 922 1793 1657 261 88 203665 41010 ALMENSILLA 8 795 1807 1806 395 86 150666 41011 ARAHAL 8 5408 17717 20555 3189 740 1843667 41012 AZNALCAZAR 8 1081 3196 3194 739 169 384668 41013 AZNALCOLLAR 8 1786 5571 5537 1017 147 327669 41014 BADOLATOSA 8 1066 3029 2867 606 100 187670 41015 BENACAZON 8 1455 4753 4753 792 205 357671 41016 BOLLULLOS DE LA MITACION 8 1927 6031 6048 889 213 432672 41017 BORMUJOS 8 1657 5277 5272 1057 191 389673 41018 BRENES 8 3473 10314 10247 2215 423 1119674 41019 BURGUILLOS 8 983 3180 3210 665 110 205675 41020 CABEZAS DE SAN JUAN, LAS 8 4377 15113 14971 3109 542 1608676 41021 CAMAS 8 8293 25501 25597 6869 1196 3524677 41022 CAMPANA, LA 8 1733 5191 5222 1150 198 351678 41023 CANTILLANA 8 3203 8788 8619 1650 454 904679 41901 CANADA ROSAL 8 1033 2842 2834 326 106 460680 41024 CARMONA 8 10949 23617 23516 5541 1070 2396681 41025 CARRION DE LOS CESPEDES 8 853 2373 2357 513 96 164682 41026 CASARICHE 8 1737 4947 4860 1064 168 381683 41027 CASTILBLANCO DE LOS ARROYOS 8 2253 4045 4063 708 163 231684 41028 CASTILLEJA DE GUZMAN 8 197 360 511 79 14 30685 41029 CASTILLEJA DE LA CUESTA 8 4869 15095 15205 4379 500 1758686 41030 CASTILLEJA DEL CAMPO 8 222 636 623 141 28 94687 41031 CASTILLO DE LAS GUARDAS, EL 8 1422 1765 1763 332 69 202688 41032 CAZALLA DE LA SIERRA 8 2548 5147 5016 1000 260 752689 41033 CONSTANTINA 8 3128 7315 7519 1449 404 1641690 41034 CORIA DEL RIO 8 7560 21928 21800 5232 1019 2020691 41035 CORIPE 8 692 1718 1602 341 75 105692 41036 CORONIL, EL 8 1674 5089 4930 962 177 439693 41037 CORRALES, LOS 8 1326 3980 3833 766 146 283694 41038 DOS HERMANAS 8 25772 78025 77997 21489 2989 10365695 41039 ECIJA 8 11794 35786 35727 8458 1796 5612696 41040 ESPARTINAS 8 1783 2819 2812 859 115 993697 41041 ESTEPA 8 3746 10961 11017 2436 635 3469698 41042 FUENTES DE ANDALUCIA 8 2541 7171 7013 1508 349 670699 41043 GARROBO, EL 8 441 741 727 150 34 79700 41044 GELVES 8 1253 4081 4084 1111 139 460

Page 81: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE A. DATOS DE LA POBLACION DCA757 78

nid codigo pueblo prov viviendas p derecho p hecho turismos locales p ocup loc

701 41045 GERENA 8 1654 5175 5176 948 173 343702 41046 GILENA 8 1401 3757 3660 752 212 445703 41047 GINES 8 2252 6351 6354 1905 255 699704 41048 GUADALCANAL 8 1406 3144 2969 626 153 361705 41049 GUILLENA 8 2805 7710 7715 1590 313 678706 41050 HERRERA 8 2129 5700 5520 1243 313 897707 41051 HUEVAR 8 782 2121 2121 427 125 180708 41052 LANTEJUELA, LA 8 1107 3254 3192 663 140 317709 41053 LEBRIJA 8 9012 28738 28388 5694 1258 3160710 41054 LORA DE ESTEPA 8 349 719 696 161 42 46711 41055 LORA DEL RIO 8 6581 18551 18131 4446 758 1790712 41056 LUISIANA, LA 8 1440 4182 4153 1110 171 422713 41057 MADRONO, EL 8 299 410 362 66 31 26714 41058 MAIRENA DEL ALCOR 8 5128 14832 14767 3417 860 2344715 41059 MAIRENA DEL ALJARAFE 8 8441 24556 24821 7242 724 2339716 41060 MARCHENA 8 6105 17221 17045 3349 772 2799717 41061 MARINALEDA 8 873 2518 2441 684 90 142718 41062 MARTIN DE LA JARA 8 903 2699 2642 485 101 128719 41063 MOLARES, LOS 8 762 2541 2510 560 69 106720 41064 MONTELLANO 8 2462 7015 7010 1370 278 542721 41065 MORON DE LA FRONTERA 8 10195 27207 26458 6521 1347 4714722 41066 NAVAS DE LA CONCEPCION, LAS 8 889 1947 1898 258 49 98723 41067 OLIVARES 8 2210 6647 6599 1313 259 468724 41068 OSUNA 8 5367 16791 16240 3449 792 2817725 41069 PALACIOS Y VILLAFRANCA, LOS 8 8228 29522 29417 5802 1035 2916726 41070 PALOMARES DEL RIO 8 1313 2494 2486 780 84 406727 41071 PARADAS 8 2316 7127 7062 1147 249 509728 41072 PEDRERA 8 1560 4691 4583 789 256 597729 41073 PEDROSO, EL 8 1258 2395 2393 431 125 216730 41074 PENAFLOR 8 1486 4049 3873 848 218 386731 41075 PILAS 8 3410 10515 10503 2182 535 1341732 41076 PRUNA 8 1195 3597 3183 487 135 191733 41077 PUEBLA DE CAZALLA, LA 8 3568 10575 10369 1662 442 1008734 41078 PUEBLA DE LOS INFANTES, LA 8 1647 3652 3457 670 152 249735 41079 PUEBLA DEL RIO, LA 8 5204 16377 16170 4119 400 1065736 41080 REAL DE LA JARA, EL 8 732 1748 1678 322 82 204737 41081 RINCONADA, LA 8 7269 21320 21195 5152 1271 3355738 41082 RODA DE ANDALUCIA, LA 8 1409 4033 3952 858 265 593739 41083 RONQUILLO, EL 8 688 1369 1373 238 68 105740 41084 RUBIO, EL 8 1206 3651 3599 1049 137 221741 41085 SALTERAS 8 946 2554 2537 641 105 636742 41086 SAN JUAN DE AZNALFARACHE 8 7365 21790 21916 6345 992 3058743 41088 SAN NICOLAS DEL PUERTO 8 368 728 645 159 49 156744 41087 SANLUCAR LA MAYOR 8 3677 9434 9448 2113 400 1285745 41089 SANTIPONCE 8 1742 6304 6171 1383 225 670746 41090 SAUCEJO, EL 8 1490 4047 3866 743 156 283747 41092 TOCINA 8 2781 8472 8404 1677 420 686748 41093 TOMARES 8 4702 13218 13226 4369 711 1655749 41094 UMBRETE 8 1013 3014 3072 880 240 389750 41095 UTRERA 8 14837 43220 43151 8987 2089 5906751 41096 VALENCINA DE LA CONCEPCION 8 2104 4410 4437 1338 285 709752 41097 VILLAMANRIQUE DE LA CONDESA 8 1398 3495 3460 816 141 252753 41100 VILLANUEVA DE SAN JUAN 8 678 1682 1632 207 70 89754 41098 VILLANUEVA DEL ARISCAL 8 1561 4052 4049 923 155 248755 41099 VILLANUEVA DEL RIO Y MINAS 8 2617 6014 6059 944 253 503756 41101 VILLAVERDE DEL RIO 8 1897 6450 6366 1224 245 704757 41102 VISO DEL ALCOR, EL 8 4497 15083 15107 3554 638 1841

Page 82: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

Apendice B. Utilizacion de losprogramas descritos y de las basesde datos

Los programas mencionados en este trabajo estan escritos en el lenguaje de controlde DBASE 1, funcionando en la version IV de dicha aplicacion, y tambien en versionesanteriores como la III PLUS, y estan preparados para ser ejecutados de forma directa,en el entorno de dicho sistema o en otros entornos compatibles, introduciendole losparametros apropiados.

Todos estos programas se incluyen en el disco que acompana al trabajo, juntocon las bases de datos, en formato DBF, que se emplean en los diferentes capıtulos, ypara su utilizacion bastara copiarlos directamente al directorio de trabajo de DBASE,quedando desde ese momento disponible para su ejecucion desde el interprete decomandos de dicho sistema.

A continuacion indicamos cada uno de estos programas y ficheros de datos conuna breve descripcion de los mismos.

PROGRAMAS

MMBZ.PRG: Obtencion de una muestra mediante muestreo de Bernoulli. Ca-pıtulo 1.

MMASZ.PRG: Obtencion de una muestra aleatoria simple mediante el metodode aceptacion y rechazo. Capıtulo 1.

FMRZ.PRG: Obtencion de una muestra aleatoria simple por el metodo de ex-ploracion de Fan, Muller y Rezucha. Capıtulo 1.

1DBASE IV es marca registrada de Ashton-Tate

79

Page 83: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE B. UTIZACION DE LOS PROGRAMAS 80

MSZ.PRG: Obtencion de una muestra perteneciente a un diseno sistematicouniforme de paso k. Capıtulo 1.

DMMASZ.PRG: Valoracion del estadıstico media muestral sobre muestras alea-torias simples, para estudiar su distribucion. Capıtulo 2.

DCMASZ.PRG: Valoracion del estadıstico cuasivarianza muestral sobre mues-tras aleatorias simples, para estudiar su distribucion. Capıtulo 2.

EMMASZ.PRG: Estimacion de la media poblacional de una variable mediantemuestreo aleatorio simple. Capıtulo 3.

SAMPFORZ.PRG: Estimacion de la media poblacional de una variable median-te una muestra obtenida por el metodo de Sampford. Capıtulo 3.

RAMASZ.PRG: Estimacion de la razon de medias poblacionales de dos variablesmediante una muestra aleatoria simple. Capıtulo 4.

EMINFZ.PRG: Estimacion de la media poblacional de una variable, empleandoinformacion auxiliar mediante los estimadores de razon y regresion. Capıtulo 5.

DHZ.PRG: Estratificacion de una poblacion por el metodo de Dalenius y Hod-ges, empleando una variable auxiliar. Capıtulo 6

PARESTZ.PRG: Estimacion de un parametro poblacional mediante muestreoestratificado. Capıtulo 6. Este programa emplea las siguientes rutinas auxiliares:

• EMMASZ6.PRG: Estimacion de la media poblacional con muestreo alea-torio simple.

• RAMASZ6.PRG: Estimacion de la razon de medias poblacionales de dosvariables, con muestreo aleatorio simple.

• EMRAZ6.PRG: Estimacion de razon de la media poblacional.

• EMREZ6.PRG: Estimacion de regresion de la media poblacional.

EMCON1Z.PRG: Estimacion de la media poblacional a partir de muestreo porconglomerados en una etapa con seleccion de los mismos mediante muestreoaleatorio simple. Capıtulo 7

RACON1Z.PRG: Estimacion de la razon de medias poblacionales de dos varia-bles a partir de muestreo por conglomerados en una etapa con seleccion de losmismos mediante muestreo aleatorio simple. Puede ser empleado tambien parala estimacion de la media poblacional, en relacion al tamano de los conglome-rados. Capıtulo 7

Page 84: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE B. UTIZACION DE LOS PROGRAMAS 81

EMCON2Z.PRG: Estimacion de la media poblacional a partir de muestreo porconglomerados en dos etapas con seleccion de los mismos mediante muestreoaleatorio simple, y aplicacion de este mismo diseno para obtener las unidadesfinales. Capıtulo 7

RACON2Z.PRG: Estimacion de la razon de medias poblacionales de dos va-riables a partir de muestreo por conglomerados en dos etapas con seleccion delos mismos mediante muestreo aleatorio simple, y seleccion de unidades finalestambien con muestreo aleatorio simple. Puede ser empleado tambien para la es-timacion de la media poblacional, en relacion al tamano de los conglomerados.Capıtulo 7

FICHEROS

DCA757.DBF: Fichero que contiene los datos de la poblacion utilizada en estetrabajo.

DCA757E1.DBF, DCA757E2.DBF, DCA757E3.DBF: Ficheros conteniendo ca-da uno de los estratos de la poblacion anterior, segun la estratificacion definidaen el Capıtulo 6.

M EST1.DBF, M EST2.DBF, M EST2.DBF: Ficheros de control, para utilizaren combinacion con el programa PARESTZ.PRG, mencionados en el Capıtulo 6.

MUESTRA.DBF, PIN.DBF, DHTABXY.DBF: Ficheros auxiliares que son uti-lizados, internamente, por diferentes programas. Estos ficheros no deben serborrados ni modificados.

Page 85: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE B. UTIZACION DE LOS PROGRAMAS 82

Referencias

[1] Asok, C. y Sukhatme, B.V. (1976). ‘On Sampford’s procedure of unequal proba-bility sampling without replacement’. J. Amer. Satist. Assoc. 71, pp. 912-918.

[2] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y aplicaciones del muestreo.Alianza Universidad Textos. Madrid.

[3] Brewer, K.R.W. y Hanif, M. (1983). Sampling with Unequal Probabilities. Springer-Verlag. New York.

[4] Cochran, W.G. (1993). Tecnicas de Muestreo. Decima reimpresion. CECSA.Mexico.

[5] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sam-pling. North Holland. Amsterdam.

[6] Dalenius, T. y Hodges, J.L. (1959). ‘Minimum variance stratification’. J. Amer.Statist. Assoc. 54, pp. 88-101.

[7] Fan, C.T., Muller, M.E., y Rezucha, I. (1962). ‘Development of sampling plansby using sequential (item by item) selection techniques and digital computers’.J. Amer. Statist. Assoc. 57, pp. 387-402.

[8] Fernandez, F.R. y Mayor, J.A. (1994). Muestreo en poblaciones finitas: cursobasico. P.P.U. Barcelona.

[9] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methodsand Theory. Vol. I y II. Wiley. New York.

[10] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite PopulationSampling. Wiley. New York.

[11] Mayor Gallego, J.A. (1995). ‘Analisis de poblaciones finitas mediante la fun-cion de dispersion. Estrategias para su estimacion’. XXII Congreso Nacional deEstadıstica e Investigacion Operativa. S.E.I.O. Sevilla 1995.

[12] Munoz Perez, J. (1990). ‘Dispersive ordering by the spread function’. Statistics& Probability Letters. 10, 407-410.

[13] Munoz Perez, J y Sanchez Gomez, A. (1990). ‘Dispersive ordering by dilation’.J. Appl. Prob. 27, 440-444.

Page 86: Pr acticas de Muestreo en Poblaciones Finitas sobre datos de la …personal.us.es/jmayor/ficheros/PREMIO.pdf · 2017-02-12 · Pr acticas de Muestreo en Poblaciones Finitas sobre

APENDICE B. UTIZACION DE LOS PROGRAMAS 83

[14] Sampford, M.R. (1967). ‘On sampling without replacement with unequal pro-babilities of selection’. Biometrika. 54, pp. 499-513.

[15] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sam-pling. Springer-Verlag. New York, Inc.

[16] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). SamplingTheory of Surveys Applications. Tercera edicion. Iowa State University Press.Ames. Iowa.