inferencia muestreo estratificado

21
1. INTRODUCCION Como parte de las actividades planificadas de investigación de la cátedra de Estadística Inferencial, procedemos a reunirnos el ventegesimo tercer día del mes abril, en casa de un compañero, ubicada en la Ciudad de El Alto, departamento de La Paz, las cinco personas integrantes del equipo, con el fin de consultar información en diferentes fuentes tanto digitales como bibliográficas, para luego compilar y presentar un esbozo respecto al tema de muestreo estratificado. Todo esto con el fin de obtener más conocimientos sobre el tema de muestreo y a la vez la aprobación de la primera unidad de esta materia. Se partió desde la lectura y selección de temas y términos básicos, hasta llegar al tema especifico que se deseaba estudiar. Se hace connotar que es de relativa importancia un estudio previo de introducción a la estadística para poder comprender lo que es en si el muestreo estratificado. Cada uno de los participantes miembros de este grupo, procedió a la investigación e indagación individual, para así reunir entre toda la información relevante y así concluir en un resumen, que compone el cuerpo de este trabajo. La estadística es una ciencia muy importante en la vida cotidiana, y gracias a esta se puede recolectar datos y generar conclusiones de las informaciones

description

inferencia muestreo estratificado

Transcript of inferencia muestreo estratificado

1. INTRODUCCIONComo parte de las actividades planificadas de investigacin de la ctedra de Estadstica Inferencial, procedemos a reunirnos el ventegesimo tercer da del mes abril, en casa de un compaero, ubicada en la Ciudad de El Alto, departamento de La Paz, las cinco personas integrantes del equipo, con el fin de consultar informacin en diferentes fuentes tanto digitales como bibliogrficas, para luego compilar y presentar un esbozo respecto al tema de muestreo estratificado. Todo esto con el fin de obtener ms conocimientos sobre el tema de muestreo y a la vez la aprobacin de la primera unidad de esta materia. Se parti desde la lectura y seleccin de temas y trminos bsicos, hasta llegar al tema especifico que se deseaba estudiar. Se hace connotar que es de relativa importancia un estudio previo de introduccin a la estadstica para poder comprender lo que es en si el muestreo estratificado. Cada uno de los participantes miembros de este grupo, procedi a la investigacin e indagacin individual, para as reunir entre toda la informacin relevante y as concluir en un resumen, que compone el cuerpo de este trabajo.La estadstica es una ciencia muy importante en la vida cotidiana, y gracias a esta se puede recolectar datos y generar conclusiones de las informaciones aportadas por esta, lo que permite comprobar y anticipar hechos, mostrar probabilidades, entre otros, para ello partimos desde el estudio de los trminos ms bsicos, conceptos, definiciones, entre otros, luego de que sinteticemos tericamente lo ms elemental entrar en materia de lo que es en si el muestro estratificado. Se reflejarn unos ejemplos que ayuden a comprender mas e igualmente, se detallan las ventajas y desventajas.A continuacin se presenta en forma de sntesis el resultado de esta investigacin tcnica desarrollada con el fin de cumplir los recaudos necesarios para la aprobacin de la unidad, que concluye con la presentacin y defensa de este informe.2. ANTECEDENTESSegn Rao (2005), el primer personaje interesado en el mtodo representativo (mas adelante conocido como teora de muestreo) fue el estadstico noruego A.N. Kaier (1897) puesto que demostr empricamente que seleccionado muestras estratificadas se obtienen mejores resultados en los estimativos de medias y totales. En 1906, Bowley utiliza aproximaciones a la distribucin normal para la estimacin de proporciones y propone la formula de la estimacin de la varianza para diseos de muestreo estratificados. Para la dcada de 1920, el mtodo representativo era usado de manera difundida en Estados Unidos y alrededor del mundo. Fue as como en 1924, el ISI (Instituto Internacional de Estadistica, por su traduccin del ingles al espaol) crea una comisin de discusin de este mtodo. Los resultados de este comit incluyen el trabajo de Bowley (1926) basado en mtodos de seleccin representativos con probabilidades de inclusin iguales. Con estos avances teoricos y con la publicacin de tablas de nmeros aleatorios por Tippett (1927) se facilit la seleccin de muestras probabilsticas. En ese mismo ao, Hubback reconoce la necesidad de utilizar este enfoque en los estudios agrcolas puesto que:

1. Evita los posibles sesgos personales2. Es posible determinar un tamao de muestra tal que satisfaga un margen de error determinado por el investigador.

El trabajo inicial de R.A. Fisher fue influenciado por Hubback. El trabajo de Bowley junto por el reporte del ISI hicieron que Neyman examinara las mismas bases de la inferencia en poblaciones finitas. En particular, el artculo de Neyman (1934) es considerado como uno de los pilares en donde descansan los fundamentos del muestreo como se conoce hoy en dia. Al respecto Lesly Kish, en un comentario al artculo de Smith (1976), asegura que Neyman hizo siete grandes contribuyen al muestreo:1. Propuestos la asignacin de Neyman para el tamao de muestras con diseos estratificados.

2. Descubri que el muestreo por conglomerados puede realizarse basado en un esquema probabilstico tal que las varianzas de los estimadores resultantes pudieran ser calculadas o estimadas.

3. Para que lo anterior se tuviera, se necesita una muestra grande de unidades.

4. Para seleccionar una muestra grande es crucial definir un marco de seleccin de nmeros aleatorios.

5. El conocimiento subjetivo del comportamiento de la poblacin puede usarse para formar subgrupos poblaciones o estratos6. Un esquema de seleccin probabilstico es mejor que un esquema de seleccin a conveniencia

7. Para convencer a los escpticos acerca de la validez de sus afirmaciones, se dispuso a realizar ejemplos prcticos con encuestas verdaderas a gran escala

La nueva teora de Neyman revoluciono el mundo del muestreo y lo libero del paradigma de inclusin igual. El introdujo, en un solo artculo, las ideas de eficiencia, asignacin ptima, , generalizacin del teorema de Markow, muestreo por conveniencia se lleva a conclusiones equivocadas. Ms adelante Neyman propuso el muestreo en dos fases, Smith (1991) afirma que el muestreo con probabilidad proporcional y el muestreo en varias etapas son resultados de las ideas de Neyman. As mismo propuso realizar la inferencia para muestras grandes basado en la teora de los intervalos de confianza (sin tener en cuenta las propiedades de la poblacin finita, fuesen cuales fuesen) cualquier mtodo que satisficiera los anteriores supuestos era llamado representativo. En 1939, cochran hace varios aportes significativos: introduce el uso del ANOVA para estimar la ganancia en eficiencia debida a la estratificacin, propone la estimacin de la varianza para encuestas de dos etapas y rene los componentes para realizar estimacin por regresin bajo muestreo en dos fases. Tambien introduce el concepto de super-poblacion la poblacin finita podra ser vista como una muestra aleatoria de una poblacin infinita. Mas adelante, Cochran introduce el estimador de razn y desarrolla la teora de estimacin de totales y medias mediante modelos de relacin. En 1994 , Madow y Madow introduce la teora del muestreo sistematico.

Mientras tanto en india, Mahanolobis funda el instituto indio de estadistica en donde hace grrandes aportes formulando expresiones de la varianza de estimadores en function del costo de una encuesta. Varios textos surgieron despues de la decada de 1940 en donde se trataba el problema de la seleccion de muestras y estimacion y de parametros en poblaciones finitas sin reemplazar y desarrollaron un elegante tratamiento del muestreo completando asi las bases de la inferencia basada en el dise;o de muestreo

La inferencia basada en el diseo (sarndal, swensson y wretman 1992) realizanlas estimaciones de los parmetros dependiendo del diseo de muestreo escogido para seleccionar la muestra sin tener en cuenta las propiedades de la poblacin finita.

Asi por ejemplo estimador del total poblacional ty estar dado por:

En donde dk es una ponderacin incluida por el diseo de muestreo. Bajo esta perspectiva, los valores yk son tomados como la observacin en el individuo k de la caracterstica de inters y. sin embargo, y no se toma como una variable aleatoria, sino como una cantidad fija.

Desde ese punto hasta nuestros das han aparecido avances y aportes y nuevas teoras de seleccin de mestras y de estimacin de parmetros mantenimiento la filosofa de la inferencia basada en el diseo de muestreo. Rao (2005) cita algunas de ellas por ejemplo: muestreo en varias ocaciones, muestras tipo panel, estimacin de funciones de distribucin y cuantiles, estimaciones en dominios pequenos, entre otras.

Porotro lado, al mismo tiempo Rao (1955) prueba el siguiente teorema que pone en tela de juicio el concepto de eficiencia el que Neyman se refera puesto que prueba que prueba que, bajo la inferencia basada en el diseo de muestreo, no existe un estimador insesgado de varianza minima.

3. JUSTIFICACION

Se recomienda cuando se tiene un conocimiento a priori de la poblacin.

Cuando se trata de elementos poblacionales susceptibles de ser clasificados.

Cuando hay inters en obtener informacin a nivel de las subpoblaciones. 4. RESUMEN4.1. Muestreo estratificado

Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.

Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado:

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres.

Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por mi y si2, respectivamente.

5. OBJETIVOS

5.1. Objetivo generalAl presentar este trabajo se espera que el curso est en capacidad de realizar diseos mustrales descriptivos adecuados y con capacidad para reflexionar sobre los parmetros requeridos en el diseo.

El estudiante estar en capacidad de aplicar mtodos apropiados de la inferencia estadstica paramtrica para obtener conclusiones poblacionales a partir de los resultados logrados en una muestra.

5.2. Objetivo especifico1. Adquirir destrezas en el manejo de formulas y problemas con muestreo estratificado.

2. Transmitir los conocimientos adquiridos por medio de este trabajo.

6. DESARROLLO DEL TEMA6.1. Introduccin al tema:

Para aplicar este diseo, se precisa que la poblacin est dividida en subpoblaciones, estratos, que no se solapen. Se selecciona una muestra probabilstica en cada estrato y se trabaja de manera independiente entre estratos.

6.1.1. Razones de la popularidad de este mtodo:

Permite realizar estimaciones de precisin especfica en cada estrato;

En un experimento, los aspectos prcticos relacionados con la respuesta, la medida o la informacin auxiliar pueden diferir considerablemente de una subpoblacin a otra.

Existirn razones administrativas, divisin territorial,....

6.1.2.Cuestiones tcnicas que plantea este muestreo:

i) Construccin de Estratos: Los objetivos del estudio y los recursos disponibles contestarn las siguientes cuestiones Qu caractersticas utilizar para dividir la poblacin en estratos?; Cmo se identificarn los estratos?; Cuntos estratos debe haber?

En particular, los estratos deben estar constituidos por unidades lo ms homogneas posibles; En el caso lmite de estricta homogeneidad bastara seleccionar una sola unidad en cada estrato

ii) Eleccin de una muestra y mtodos de estimacin en cada estrato; El proceso de muestreo se realizar de manera independiente en cada estrato

6.1.3.Ventajas de este diseo:

i) Si las mediciones dentro de cada estrato son homognes, la estratificacin producir un lmite ms pequeo para el error de estimacin que el m.a.

ii) Se puede reducir el costo por observacin al estratificar la poblacin en grupos convenientes.

iii) Permite obtener estimaciones de parmetros poblacionales para subgrupos de la poblacin.

Ejemplos:

i) El I.P.C. se obtiene a partir de encuestas a:

Ciudades

Familias urbanas

Empresas de bienes y sevicios

Bienes y servicios especficos

ii) Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea rural 93.

6.2. Notacin y Definiciones:

Definicin:

Dada una poblacin U = [y1, . . . , yN ]se entiende por estratificacin una particin

de U en L subpoblaciones llamadas estratos, U1 =[y11, ..., y1N1 ]= [yk / k U1], . . . , UL =[y11, . . . , y1NL ]=[yk / k UL ], verificndose que N1 +. . . +NL =N.6.3. Proceso para realizar un Muestreo Estratificado

6.4. Notacin especfica para este muestreo:

Nh

: Nmero total de unidades en el estrato h,

Nh

: Nmero de unidades de la muestra en el estrato h,

xih

: Valor obtenido en la unidad i del estrato h,

Wh =Nh/N: Ponderacin del estrato h,

fh =nh/Nh: Fraccin de muestreo en el estrato h,

Xh

: Media poblacional del estrato h,

Xh

: Media muestral del estrato h,

S2h

: Cuasivarianza poblacional del estrato h.

6.5. Estimacin de los Intervalos de Confianza6.6. Eleccin del tamao muestral en los estratos: Afijacin

6.7. Determinacin del tamao muestral para un error mximo admisible e = | | con nivel de confianza pk:

Debe tomarse como tamao muestral n el valor entero ms prximo por exceso al obtenido en la formula. Como puede verse en las formulas, para determinar el tamao muestral se necesita conocer: los tamaos de los estratos, el error y el nivel de confianza, la variabilidad de cada estrato y el peso correspondiente a cada estrato en la muestra, es decir la afijacin usada, la cual me determina que wh debo sustituir en cada formula.6.8. Estratificacin a posteriori:

Si no se puede conocer el estrato al cual pertenece una unidad hasta que no se obtienen todos los datos, se debe realizar una estratificacin a posteriori que consiste en estudiar un carcter sobre una poblacin, de la cual se conoce otro carcter.

El mtodo consiste en tomar una muestra de la poblacin de la cual se obtienen los valores de los dos caracteres, el que se desea estudiar y el que se conoce y se definen los estratos a posteriori segn la variable conocida.

Si el carcter conocido est relacionado con el que se desea estudiar, el tipo de muestra ser representativa y conducir a mejores resultados que si no hubiera habido estratificacin.

Sus estimadores tienen la misma frmula que los estimadores estratificados, por ejemplo,

7. BIBLIOGRAFIA8. FORMULARIO

9. ANEXOS