01 Muestreo

download 01 Muestreo

of 12

description

estadistica

Transcript of 01 Muestreo

  • Sabino Edgar Mamani Ch.

    1

    TCNICAS DE MUESTREO.

    El objetivo del muestreo es contar con el mayor nmero de unidades, con la mayor cantidad deinformacin, pero al menor costo posible. Para el diseo de la muestra y clculo del tamao sedebe considerar lo siguiente:

    1. Planteamiento del problema. Se debe determinar con claridad la necesidad de realizar untrabajo de investigacin, para lo cual se debe revisar toda la informacin necesaria que permitaconocer con mayor profundidad el problema.

    2. Establecer el o los objetivos de manera clara y precisa, los mismos que no se deben perder devista a lo largo del proceso de investigacin.

    3. Determinar la poblacin objetivo, que debe estar claramente definida y plenamenteidentificada al inicio del proceso de seleccin y entrevista. Significa identificar la unidad o elelemento en forma clara, mensurable, adecuada y comparable.

    4. Formulacin de hiptesis. Ejemplos: Se observan variaciones en las cantidades consumidas,frente a variaciones de precios y marcas; El consumo de ... es bajo en comparacin con elmnimo nutricional recomendable.

    5. Elaboracin del marco de referencia, que consiste en un listado de todas las unidades queconstituyen la poblacin objetivo, y que deben estar relacionados con un mapa o croquis queindique la localizacin de las unidades.

    Poblacin. Conjunto total de individuos o elementos objeto de una investigacin.

    Debe estar definido en trminos de:Caractersticas fsicasCobertura (geogrfica o institucional)Tiempo.

    Muestra. Cualquier sub conjunto de la poblacin en referencia

    Muestras determinsticas (no expandible)Muestras probabilsticas (teora de muestreo)

    Probabilidad de seleccin.

    Valor entre 0 y 1 que mide la posibilidad de que un elemento de la poblacin pertenezca a lamuestra.

    Parmetro.

    Expresin numrica que sintetiza los valores de una caracterstica de la poblacin en estudio.

    La media La varianza 2La proporcin P

  • Sabino Edgar Mamani Ch.

    2

    Estimador.

    Valor aproximado del parmetro y se obtiene de la informacin recolectada en la muestra.

    La media muestral XLa varianza muestral S2La proporcin muestral p

    Alternativas para estudiar una poblacin

    SondeosDiseos experimentalesCensosMuestreos

    Ventajas del muestreo

    CostoOportunidad Rapidez tiempoPrecisinEstudios en el tiempoProfundidad de temasProcesamiento y produccin de resultadosInferencia

    Desventajas.

    Niveles de desagregacinIdentificacin individualFenmenos de baja frecuencia

    Muestreo de elementos

    El elemento o individuo es la unidad de muestreo.El marco de referencia es la lista de los elementos como base para la seleccin de la muestra.No es recomendable en poblaciones muy grandes.

    Problemas de marco de referencia.

    Elementos faltantes CobeturaElementos duplicadosElementos extraos

  • Sabino Edgar Mamani Ch.

    3

    Tamao ptimo de la muestra (n).

    Debe ser pequea para que el costo de la investigacin se suficientemente bajo, y bastante grandepara que el error de muestreo sea admisible.

    Componentes en el proceso de clculo (factores determinantes).

    a. Error muestral (E).

    Diferencia entre le valor poblacional (parmetro) y la estimacin de la misma (estimador),obtenida por muestra aleatoria.

    E = X - = X E

    En muchos casos el error es determinado por el investigador, y requiere conocimiento sobre lascaractersticas de la poblacin en estudio.

    Resulta prctico determinar el error como un porcentaje (la mayora de la veces no mayor del10%) respecto de la media aritmtica E = (%) (X).

    El porcentaje podra considerarse como complemento del nivel de confianza: una confianza del95% dara supuestamente un error del 5%. Pero no siempre debe ser el complemento, porquedepender del grado de precisin con que se desea hacer la estimacin.

    Existe otro tipo de error ajeno al muestreo: medicin incorrecta, cuestionarios mal definidos,errores del entrevistador en preguntas / interpretacin de respuestas, etc.

    b. La varianza.

    El tamao de la muestra depende en gran medida de la variabilidad (ejm. muestreo de sangre,fumadores).

    Cuando no se conoce la varianza (no existe informacin sobre la poblacin) se debe realizar unaencuesta piloto, cuyo tamao lo fija el investigador (arbitrario; ejm. 5%) en base al tamao de lapoblacin, tiempo y costo.

    Permite determinar fallas de encuesta, familiaridad con encuestas, tiempo de entrevista, etc

    c. Nivel de confianza.

    Fijado por el investigador. Generalmente se trabaja con Z=2, valor correspondiente a un nivel deconfianza del 95.5%. Otros valores:

    Z Nivel de confianza (%)1.641.962.57

    909599

  • Sabino Edgar Mamani Ch.

    4

    MUESTREO ALEATORIO SIMPLE

    Tcnica sencilla y conocidaAplicable en poblaciones homogneasTcnica complementaria en otros diseosLa poblacin debe estar enumerada o codificada consecutivamenteSeleccionar n elementos aleatoriamenteProbabilidad de seleccin f = n / N

    Ejemplo.

    El proceso de planificacin de una regin ganadera requiere de diferentes trabajos deinvestigacin. Cuenta con una poblacin de 2,500 productores. Determine el tamao ptimo demuestra sobre la base de: a) nmero de vacas lecheras por hato, b) el rendimiento promedio deleche por hato, c) la proporcin de hatos con un rendimiento con un rendimiento promedio mayora 250 litros; para todos los casos considere un error del 7% y un nivel de confianza del 95.5%.

    Los resultados de una encuesta preliminar de tamao 50, fueron los siguientes:

    a) Promedio de vacas por hato, 25 y desviacin estndar, 18.b) Rendimiento promedio del leche por hato, 225 litros y varianza 4,225.c) 70% de los hatos tienen rendimiento promedio mayor a 250 litros.

    Solucin.

    a) Promedio de vacas por hato:

    25XD.E : 18N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50

    E = 0.07 x 25 = 1.75

    12

    22

    021nE

    SZn

  • Sabino Edgar Mamani Ch.

    5

    Nn

    nn

    0

    0

    1

    n0 = 22 x(324) 1 + 2 . = 440.111.752 50

    n = 440.11 . = 374.23 3741 + 440.11 .

    2500

    b) Rendimiento promedio de leche por hato.

    225XS2 : 4225N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50

    E = 0.07 x 225 = 15.75

    n0 = 22 x(4225) 1 + 2 . = 70.8515.752 50

    n = 70.85 . = 68.89 691 + 70.85 .

    2500

    c) 70% de los hatos tienen rendimiento promedio mayor a 250 litros

    P = 0.7, Q = 0.3Sp2 : PQ = 0.7 x 0.3 = 0.21N : 2,500Error : 7%P : 95.5% esta asociado a un valor Z = 2n1 : 50

    n0 = Z2 PQ 1 + 2 .E2 n1

  • Sabino Edgar Mamani Ch.

    6

    n = n0 .1 + no .

    N

    n0 = 22 (0.21) 1 + 2 . = 178.290.072 50

    n = 178.29 . = 166.42 1661 + 178.29 .

    2500

    Si la investigacin es la ganadera en la mayora de aspectos, el n optimo es (a).

    Si E y P toman otros valores?

    Muestreo Aleatorio Simple

    Cuando no se conoce la varianza poblacional (es muy frecuente)

    Se debe tomar en cuenta las investigaciones similares realizadas con anterioridad, de lo contrariorealizar encuesta preliminar.

    Ejemplo.

    N = 300 familiasError 5%P : 95.5% esta asociado a un valor Z = 2

    n se puede determinar de tres formas:

    a).n0 = Z2 S2 .

    E2

    n = n0 .1 + no .

    N

    b). 22222

    SZNESNZn

    .

  • Sabino Edgar Mamani Ch.

    7

    c).

    NSZE

    Sn 22

    2

    )/(

    Encuesta piloto (5% de la poblacin)

    npiloto = 0.05(300) = 15

    Resultados de encuesta piloto

    Ingreso Vivienda Nmero total Con Consumo diarioNo. (S/.) propia de personas M F empleo de carne (gr)

    1 850 Si 4 2 2 1 7502 260 Si 4 1 3 1 7453 990 Si 3 2 1 2 4904 810 No 4 2 2 1 4705 390 No 6 3 3 3 5506 870 Si 5 2 3 2 5807 670 Si 2 1 1 1 5908 355 No 3 1 2 1 5009 680 Si 2 1 1 1 520

    10 385 Si 2 1 1 1 48011 335 No 2 1 1 2 44012 620 Si 5 2 3 2 68013 780 Si 4 2 2 1 78014 605 No 3 1 2 2 82015 675 Si 3 2 1 1 600

    Promedio 618.33 p=10 599.67Desv. Est. 225.59 q=5 125.11

    Solucin.

    a). Basado en el ingreso.

    a.1E = 0.05 (618.33) = 30.92

    n0 = 22 (50890.85) . = 212.9230.922

    n = 212.92 . = 124.53 125

  • Sabino Edgar Mamani Ch.

    8

    1 + 212.92 .300

    a.2 n = 300 (22) (50890.85) . = 124.53 125300(30.92)2 + 22 (50890.85)

    a.3 n = 50890.85 . = 124.53 125(30.92/2)2 + (50890.85)/300

    Nota. El coeficiente de variabilidad para esta variable es :

    100*XSCV = (225.59/618.33)x100 = 36.48%

    b) Basado en el consumo promedio de carne por da por familia.

    E = 0.05 (599.67) = 29.98

    n = NZ2S2 .NE2 + Z2S2

    n = 300 (22) (15652.51) . = 56.53 57300(29.98)2 + 22 (15652.51)

    Nota. El coeficiente de variabilidad para esta variable es :

    100*XSCV = (125.11/599.67)x100 = 20.86%

    c) Basado en la proporcin de familias con vivienda propia.

    Con vivienda propia 10,P = 10 / 15 = 0.67 Q = 5/15 = 0.33Sp2 = PQ = 0.67 (0.33) = 0.2211

    n = NZ2 PQ .NE2 + Z2 PQ

    n = 300(22)(0.2211) . = 162.33 162300(0.052) + 22 (0.2211)

    Muestreo Aleatorio Estratificado.

    Cuando la caracterstica que se investiga tienen alta variabilidad

  • Sabino Edgar Mamani Ch.

    9

    Este tipo de muestreo permite:

    a. Mayor precisin de los estimadores, pese a que el nmero de unidades seleccionadas es menorrespecto del M.A.S.

    b. Garantiza la representatividad y una reduccin del error de la muestra, por agrupacin deelementos que se parecen mas por caracterstica que se investiga que por pertenecer a lapoblacin.

    c. Agrupar a la poblacin por estratos homogneos, pero heterogneos entre estratos.

    Simbologa.

    N : PoblacinNh : Poblacin de cada estrato.h : Identifica a cada estrato h = 1,2, ...Nh = N = N1 + N2 + ... NM

    hX Media aritmtica poblacional de cada estrato

    STX : Media aritmtica poblacional ponderada por estrato

    hhhh

    ST WXNNX

    X

    Wh : Proporcin de elementos en cada estrato

    Wh = Nh / N

    Wh = W1 + W2 + ... WM = 1

    Sh2 : Varianza poblacional en cada estrato

    1)( 22

    h

    hhhih N

    XNXS

    n : No. de unidades de la muestra totaln1 : No. de unidades de la muestra en cada estrato

    a). Asignacin igual.

    Ejemplo.

    Estrato IEstrato IIEstrato III

    Ingresos menores a S/ 600Ingresos entre S/600 y S/ 900Ingresos mayores a S/900

    N1N2N3

    250 familias180 familias70 familias

    N 500 familias

  • Sabino Edgar Mamani Ch.

    10

    Proporcin de unidades en cada estrato:

    Estrato IEstrato IIEstrato III

    N1 = 250N2 =180N3 = 70

    W1 = N1/NW2 = N2/NW3 = N3/N

    W1 = 250/500 = 0.50W2 = 180/500 = 0.36W3 = 70 /500 = 0.14

    N = 500

    Encuesta piloto al 4% de la poblacin:

    npiloto = 0.04 (500) = 20 familias

    nh = npiloto / L = 20/3 = 6.67 7

    donde L : Nmero de estratosn1 = n2 = n3 = 7 npiloto = 21 familias

    Resultados de encuesta piloto.

    Media aritmtica Desviacin estndar Varianza_X1 = 420_X2 = 695_X3 = 1100

    S1 = 133.90

    S2 = 25.40

    S3 = 165.50

    S12 = 17,929.21

    S22 = 645.16

    S32 = 27,390.25

    Media aritmtica ponderada por estrato._ _Xst = WhXh = (0.50 x 420) + (0.36 x 695) + ( 0.14 x 1,100) = 614.2

    _Error = 7% de Xst

    E = 0.07 (614.2) = 42.99

    P = 95.5%, nivel de confianza (Z=2)

    Se puede determinar de dos formas:

    a. n0 = (1/V) WhSh2

    donde V = (E/Z)2

    n = n0 .1 + (no/N)

  • Sabino Edgar Mamani Ch.

    11

    b. n = NZ2 WhSh2 .NE2 +Z2WhSh2

    Solucin.

    a. V = (42.99/2)2 = 462.04

    n0 = (1/462.04) [ (0.5 x 17,929.21) + (0.36 x 645.16) + ( 0.14 x 27,390.25) ] = 28.20

    n = 28.20 . = 26.69 271 + (28.20/500)

    b. n = 500(22) [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)] .500(42.992) +22 [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)]

    . n = 26.69 27Asignacin igual

    nh = n / 3 = 27 / 3 = 9 familias por estrato

    Asignacin proporcional

    n1 = nW1 = 27 (0.50) = 13.5 14 familiasn2 = nW2 = 27 (0.36) = 9.72 10 familiasn3 = nW3 = 27 (0.14) = 3.78 4 familias

    n = 18 familias

    Determinacin de n en base a proporciones.

    Ejemplo.

    En base a la informacin anterior y:

    Estrato I N1 = 250 W1 = 0.50Estrato II N2 = 180 W2 = 0.36Estrato III N3 = 70 W3 = 0.14

    N = 500Error 9%P = 95.5%, nivel de confianza (Z = 2)

    Se conoce que la proporcin de familias con vivienda propia en cada estrato es:

    Encuesta piloto = 18 familiasP1 = 3/6 = 0.50 Q1 = 0.50P2 = 4/6 = 0.67 Q1 = 0.33

  • Sabino Edgar Mamani Ch.

    12

    P3 = 5/6 = 0.83 Q1 = 0.17

    n = NZ2 WhPhQh .NE2 + Z2WhPhQh

    n = 500(22) [(0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)] .500 (0.092) [(0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)]

    n = 90.96 91

    Asignacin igual

    n1 = n2 = n3 = n / L = 91 / 3 = 30.33 31 n = 93

    Asignacin proporcional.n1 = n W1 = 91 (0.50) = 45.50 46n2 = n W2 = 91 (0.36) = 32.76 33n1 = n W1 = 91 (0.14) = 12.74 13n = 92 familias

    BIBLIOGRAFA.

    Cody Ronald and Smith Jeffrey. 1991. Applied Statistics and the SAS Programming Language.Prentice Hall. Third Edition.

    Cortez Cumpa Jorge. 1994. Tcnicas Estadsticas de Prediccin Aplicables en el CampoEmpresarial. Universidad del Pacfico. Lima Per.

    Martinez Bencardino, Ciro. 2002. Estadstica y Muestreo. ECOE Ediciones. Bogot. Colombia.

    Prez Lpez Csar. 2001. El Sistema Estadstico SAS. The SAS System for Windows 8e.Prentice Hall.

    SAS Institute Inc. 1988. SAS/STAT. Users Guide. Release 6.03 Edition.Cary, NC, USA.

    SAS Institute Inc. 1988. SAS Language Guide for Personal Computers. Release 6.03 Edition.Cary,NC, USA.

    Webster Allen. 2000. Estadstica Aplicada a los Negocios y la Economa. Mc Graw Hill. TerceraEdicin. Colombia.