01 Muestreo
-
Upload
julio-perez-pari -
Category
Documents
-
view
216 -
download
0
description
Transcript of 01 Muestreo
-
Sabino Edgar Mamani Ch.
1
TCNICAS DE MUESTREO.
El objetivo del muestreo es contar con el mayor nmero de unidades, con la mayor cantidad deinformacin, pero al menor costo posible. Para el diseo de la muestra y clculo del tamao sedebe considerar lo siguiente:
1. Planteamiento del problema. Se debe determinar con claridad la necesidad de realizar untrabajo de investigacin, para lo cual se debe revisar toda la informacin necesaria que permitaconocer con mayor profundidad el problema.
2. Establecer el o los objetivos de manera clara y precisa, los mismos que no se deben perder devista a lo largo del proceso de investigacin.
3. Determinar la poblacin objetivo, que debe estar claramente definida y plenamenteidentificada al inicio del proceso de seleccin y entrevista. Significa identificar la unidad o elelemento en forma clara, mensurable, adecuada y comparable.
4. Formulacin de hiptesis. Ejemplos: Se observan variaciones en las cantidades consumidas,frente a variaciones de precios y marcas; El consumo de ... es bajo en comparacin con elmnimo nutricional recomendable.
5. Elaboracin del marco de referencia, que consiste en un listado de todas las unidades queconstituyen la poblacin objetivo, y que deben estar relacionados con un mapa o croquis queindique la localizacin de las unidades.
Poblacin. Conjunto total de individuos o elementos objeto de una investigacin.
Debe estar definido en trminos de:Caractersticas fsicasCobertura (geogrfica o institucional)Tiempo.
Muestra. Cualquier sub conjunto de la poblacin en referencia
Muestras determinsticas (no expandible)Muestras probabilsticas (teora de muestreo)
Probabilidad de seleccin.
Valor entre 0 y 1 que mide la posibilidad de que un elemento de la poblacin pertenezca a lamuestra.
Parmetro.
Expresin numrica que sintetiza los valores de una caracterstica de la poblacin en estudio.
La media La varianza 2La proporcin P
-
Sabino Edgar Mamani Ch.
2
Estimador.
Valor aproximado del parmetro y se obtiene de la informacin recolectada en la muestra.
La media muestral XLa varianza muestral S2La proporcin muestral p
Alternativas para estudiar una poblacin
SondeosDiseos experimentalesCensosMuestreos
Ventajas del muestreo
CostoOportunidad Rapidez tiempoPrecisinEstudios en el tiempoProfundidad de temasProcesamiento y produccin de resultadosInferencia
Desventajas.
Niveles de desagregacinIdentificacin individualFenmenos de baja frecuencia
Muestreo de elementos
El elemento o individuo es la unidad de muestreo.El marco de referencia es la lista de los elementos como base para la seleccin de la muestra.No es recomendable en poblaciones muy grandes.
Problemas de marco de referencia.
Elementos faltantes CobeturaElementos duplicadosElementos extraos
-
Sabino Edgar Mamani Ch.
3
Tamao ptimo de la muestra (n).
Debe ser pequea para que el costo de la investigacin se suficientemente bajo, y bastante grandepara que el error de muestreo sea admisible.
Componentes en el proceso de clculo (factores determinantes).
a. Error muestral (E).
Diferencia entre le valor poblacional (parmetro) y la estimacin de la misma (estimador),obtenida por muestra aleatoria.
E = X - = X E
En muchos casos el error es determinado por el investigador, y requiere conocimiento sobre lascaractersticas de la poblacin en estudio.
Resulta prctico determinar el error como un porcentaje (la mayora de la veces no mayor del10%) respecto de la media aritmtica E = (%) (X).
El porcentaje podra considerarse como complemento del nivel de confianza: una confianza del95% dara supuestamente un error del 5%. Pero no siempre debe ser el complemento, porquedepender del grado de precisin con que se desea hacer la estimacin.
Existe otro tipo de error ajeno al muestreo: medicin incorrecta, cuestionarios mal definidos,errores del entrevistador en preguntas / interpretacin de respuestas, etc.
b. La varianza.
El tamao de la muestra depende en gran medida de la variabilidad (ejm. muestreo de sangre,fumadores).
Cuando no se conoce la varianza (no existe informacin sobre la poblacin) se debe realizar unaencuesta piloto, cuyo tamao lo fija el investigador (arbitrario; ejm. 5%) en base al tamao de lapoblacin, tiempo y costo.
Permite determinar fallas de encuesta, familiaridad con encuestas, tiempo de entrevista, etc
c. Nivel de confianza.
Fijado por el investigador. Generalmente se trabaja con Z=2, valor correspondiente a un nivel deconfianza del 95.5%. Otros valores:
Z Nivel de confianza (%)1.641.962.57
909599
-
Sabino Edgar Mamani Ch.
4
MUESTREO ALEATORIO SIMPLE
Tcnica sencilla y conocidaAplicable en poblaciones homogneasTcnica complementaria en otros diseosLa poblacin debe estar enumerada o codificada consecutivamenteSeleccionar n elementos aleatoriamenteProbabilidad de seleccin f = n / N
Ejemplo.
El proceso de planificacin de una regin ganadera requiere de diferentes trabajos deinvestigacin. Cuenta con una poblacin de 2,500 productores. Determine el tamao ptimo demuestra sobre la base de: a) nmero de vacas lecheras por hato, b) el rendimiento promedio deleche por hato, c) la proporcin de hatos con un rendimiento con un rendimiento promedio mayora 250 litros; para todos los casos considere un error del 7% y un nivel de confianza del 95.5%.
Los resultados de una encuesta preliminar de tamao 50, fueron los siguientes:
a) Promedio de vacas por hato, 25 y desviacin estndar, 18.b) Rendimiento promedio del leche por hato, 225 litros y varianza 4,225.c) 70% de los hatos tienen rendimiento promedio mayor a 250 litros.
Solucin.
a) Promedio de vacas por hato:
25XD.E : 18N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50
E = 0.07 x 25 = 1.75
12
22
021nE
SZn
-
Sabino Edgar Mamani Ch.
5
Nn
nn
0
0
1
n0 = 22 x(324) 1 + 2 . = 440.111.752 50
n = 440.11 . = 374.23 3741 + 440.11 .
2500
b) Rendimiento promedio de leche por hato.
225XS2 : 4225N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50
E = 0.07 x 225 = 15.75
n0 = 22 x(4225) 1 + 2 . = 70.8515.752 50
n = 70.85 . = 68.89 691 + 70.85 .
2500
c) 70% de los hatos tienen rendimiento promedio mayor a 250 litros
P = 0.7, Q = 0.3Sp2 : PQ = 0.7 x 0.3 = 0.21N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50
n0 = Z2 PQ 1 + 2 .E2 n1
-
Sabino Edgar Mamani Ch.
6
n = n0 .1 + no .
N
n0 = 22 (0.21) 1 + 2 . = 178.290.072 50
n = 178.29 . = 166.42 1661 + 178.29 .
2500
Si la investigacin es la ganadera en la mayora de aspectos, el n optimo es (a).
Si E y P toman otros valores?
Muestreo Aleatorio Simple
Cuando no se conoce la varianza poblacional (es muy frecuente)
Se debe tomar en cuenta las investigaciones similares realizadas con anterioridad, de lo contrariorealizar encuesta preliminar.
Ejemplo.
N = 300 familiasError 5%P : 95.5% esta asociado a un valor Z = 2
n se puede determinar de tres formas:
a).n0 = Z2 S2 .
E2
n = n0 .1 + no .
N
b). 22222
SZNESNZn
.
-
Sabino Edgar Mamani Ch.
7
c).
NSZE
Sn 22
2
)/(
Encuesta piloto (5% de la poblacin)
npiloto = 0.05(300) = 15
Resultados de encuesta piloto
Ingreso Vivienda Nmero total Con Consumo diarioNo. (S/.) propia de personas M F empleo de carne (gr)
1 850 Si 4 2 2 1 7502 260 Si 4 1 3 1 7453 990 Si 3 2 1 2 4904 810 No 4 2 2 1 4705 390 No 6 3 3 3 5506 870 Si 5 2 3 2 5807 670 Si 2 1 1 1 5908 355 No 3 1 2 1 5009 680 Si 2 1 1 1 520
10 385 Si 2 1 1 1 48011 335 No 2 1 1 2 44012 620 Si 5 2 3 2 68013 780 Si 4 2 2 1 78014 605 No 3 1 2 2 82015 675 Si 3 2 1 1 600
Promedio 618.33 p=10 599.67Desv. Est. 225.59 q=5 125.11
Solucin.
a). Basado en el ingreso.
a.1E = 0.05 (618.33) = 30.92
n0 = 22 (50890.85) . = 212.9230.922
n = 212.92 . = 124.53 125
-
Sabino Edgar Mamani Ch.
8
1 + 212.92 .300
a.2 n = 300 (22) (50890.85) . = 124.53 125300(30.92)2 + 22 (50890.85)
a.3 n = 50890.85 . = 124.53 125(30.92/2)2 + (50890.85)/300
Nota. El coeficiente de variabilidad para esta variable es :
100*XSCV = (225.59/618.33)x100 = 36.48%
b) Basado en el consumo promedio de carne por da por familia.
E = 0.05 (599.67) = 29.98
n = NZ2S2 .NE2 + Z2S2
n = 300 (22) (15652.51) . = 56.53 57300(29.98)2 + 22 (15652.51)
Nota. El coeficiente de variabilidad para esta variable es :
100*XSCV = (125.11/599.67)x100 = 20.86%
c) Basado en la proporcin de familias con vivienda propia.
Con vivienda propia 10,P = 10 / 15 = 0.67 Q = 5/15 = 0.33Sp2 = PQ = 0.67 (0.33) = 0.2211
n = NZ2 PQ .NE2 + Z2 PQ
n = 300(22)(0.2211) . = 162.33 162300(0.052) + 22 (0.2211)
Muestreo Aleatorio Estratificado.
Cuando la caracterstica que se investiga tienen alta variabilidad
-
Sabino Edgar Mamani Ch.
9
Este tipo de muestreo permite:
a. Mayor precisin de los estimadores, pese a que el nmero de unidades seleccionadas es menorrespecto del M.A.S.
b. Garantiza la representatividad y una reduccin del error de la muestra, por agrupacin deelementos que se parecen mas por caracterstica que se investiga que por pertenecer a lapoblacin.
c. Agrupar a la poblacin por estratos homogneos, pero heterogneos entre estratos.
Simbologa.
N : PoblacinNh : Poblacin de cada estrato.h : Identifica a cada estrato h = 1,2, ...Nh = N = N1 + N2 + ... NM
hX Media aritmtica poblacional de cada estrato
STX : Media aritmtica poblacional ponderada por estrato
hhhh
ST WXNNX
X
Wh : Proporcin de elementos en cada estrato
Wh = Nh / N
Wh = W1 + W2 + ... WM = 1
Sh2 : Varianza poblacional en cada estrato
1)( 22
h
hhhih N
XNXS
n : No. de unidades de la muestra totaln1 : No. de unidades de la muestra en cada estrato
a). Asignacin igual.
Ejemplo.
Estrato IEstrato IIEstrato III
Ingresos menores a S/ 600Ingresos entre S/600 y S/ 900Ingresos mayores a S/900
N1N2N3
250 familias180 familias70 familias
N 500 familias
-
Sabino Edgar Mamani Ch.
10
Proporcin de unidades en cada estrato:
Estrato IEstrato IIEstrato III
N1 = 250N2 =180N3 = 70
W1 = N1/NW2 = N2/NW3 = N3/N
W1 = 250/500 = 0.50W2 = 180/500 = 0.36W3 = 70 /500 = 0.14
N = 500
Encuesta piloto al 4% de la poblacin:
npiloto = 0.04 (500) = 20 familias
nh = npiloto / L = 20/3 = 6.67 7
donde L : Nmero de estratosn1 = n2 = n3 = 7 npiloto = 21 familias
Resultados de encuesta piloto.
Media aritmtica Desviacin estndar Varianza_X1 = 420_X2 = 695_X3 = 1100
S1 = 133.90
S2 = 25.40
S3 = 165.50
S12 = 17,929.21
S22 = 645.16
S32 = 27,390.25
Media aritmtica ponderada por estrato._ _Xst = WhXh = (0.50 x 420) + (0.36 x 695) + ( 0.14 x 1,100) = 614.2
_Error = 7% de Xst
E = 0.07 (614.2) = 42.99
P = 95.5%, nivel de confianza (Z=2)
Se puede determinar de dos formas:
a. n0 = (1/V) WhSh2
donde V = (E/Z)2
n = n0 .1 + (no/N)
-
Sabino Edgar Mamani Ch.
11
b. n = NZ2 WhSh2 .NE2 +Z2WhSh2
Solucin.
a. V = (42.99/2)2 = 462.04
n0 = (1/462.04) [ (0.5 x 17,929.21) + (0.36 x 645.16) + ( 0.14 x 27,390.25) ] = 28.20
n = 28.20 . = 26.69 271 + (28.20/500)
b. n = 500(22) [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)] .500(42.992) +22 [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)]
. n = 26.69 27Asignacin igual
nh = n / 3 = 27 / 3 = 9 familias por estrato
Asignacin proporcional
n1 = nW1 = 27 (0.50) = 13.5 14 familiasn2 = nW2 = 27 (0.36) = 9.72 10 familiasn3 = nW3 = 27 (0.14) = 3.78 4 familias
n = 18 familias
Determinacin de n en base a proporciones.
Ejemplo.
En base a la informacin anterior y:
Estrato I N1 = 250 W1 = 0.50Estrato II N2 = 180 W2 = 0.36Estrato III N3 = 70 W3 = 0.14
N = 500Error 9%P = 95.5%, nivel de confianza (Z = 2)
Se conoce que la proporcin de familias con vivienda propia en cada estrato es:
Encuesta piloto = 18 familiasP1 = 3/6 = 0.50 Q1 = 0.50P2 = 4/6 = 0.67 Q1 = 0.33
-
Sabino Edgar Mamani Ch.
12
P3 = 5/6 = 0.83 Q1 = 0.17
n = NZ2 WhPhQh .NE2 + Z2WhPhQh
n = 500(22) [(0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)] .500 (0.092) [(0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)]
n = 90.96 91
Asignacin igual
n1 = n2 = n3 = n / L = 91 / 3 = 30.33 31 n = 93
Asignacin proporcional.n1 = n W1 = 91 (0.50) = 45.50 46n2 = n W2 = 91 (0.36) = 32.76 33n1 = n W1 = 91 (0.14) = 12.74 13n = 92 familias
BIBLIOGRAFA.
Cody Ronald and Smith Jeffrey. 1991. Applied Statistics and the SAS Programming Language.Prentice Hall. Third Edition.
Cortez Cumpa Jorge. 1994. Tcnicas Estadsticas de Prediccin Aplicables en el CampoEmpresarial. Universidad del Pacfico. Lima Per.
Martinez Bencardino, Ciro. 2002. Estadstica y Muestreo. ECOE Ediciones. Bogot. Colombia.
Prez Lpez Csar. 2001. El Sistema Estadstico SAS. The SAS System for Windows 8e.Prentice Hall.
SAS Institute Inc. 1988. SAS/STAT. Users Guide. Release 6.03 Edition.Cary, NC, USA.
SAS Institute Inc. 1988. SAS Language Guide for Personal Computers. Release 6.03 Edition.Cary,NC, USA.
Webster Allen. 2000. Estadstica Aplicada a los Negocios y la Economa. Mc Graw Hill. TerceraEdicin. Colombia.