Clase 9 Muestreo y Distribuciones Muestrales

download Clase 9 Muestreo y Distribuciones Muestrales

of 10

Transcript of Clase 9 Muestreo y Distribuciones Muestrales

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    1/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 1

    UNIDAD 3: MTODOS DE MUESTREO Y DISTRIBUCIONES MUESTRALES

    INTRODUCCINEn muchas investigaciones estadsticas el objetivo principal puede ser el estudio de un parmetro oalguna caracterstica de la poblacin. Dicha caracterstica se presenta mediante una v.a. X. Asociada

    a la v.a. est su distribucin de probabilidad fx(x;), donde representa al parmetro.Por ejemplo, si se deseara tener informacin acerca de las utilidades obtenidas en el ao 2012 por lasempresas mineras que operan en el Per, el modelo asociado a la v.a. X que representa las utilidades

    podra ser la distribucin normal, la cual depende de dos parmetros, uno de los parmetros sera lautilidad promedio de las empresas.

    En estadstica descriptiva se desarrollan mtodos para recolectar, presentar y resumir datos.

    Mediante la teora de probabilidad se determinan los fundamentos de los modelos para describirfenmenos que presentan variabilidad.

    Ahora, mediante la estadstica inferencial se desarrollan mtodos para obtener conclusiones validasacerca de algunas caractersticas de la poblacin, en base a la informacin contenida en una muestraaleatoria. La inferencia estadstica es de naturaleza inductiva, emplea razonamientos que van de lo

    particular a lo general y de lo observado a lo no observado.

    Mediante la inferencia estadstica, una vez elegida la muestra, se abordan los dos siguientes aspectos:(1) estimar el valor del parmetro desconocido (estimacin de parmetros) y (2) "decidir" si esigual o no a cierto valor predeterminado (prueba de hiptesis).

    La metodologa para hacer inferencias se apoya en la teora de la probabilidad.

    A continuacin, definimos algunos trminos que se utilizan en la estadstica inferencial, dentro delcontexto de una investigacin estadstica.

    INFERENCIA ESTADSTICA PARAMTRICA

    Cuando los procedimientos inferenciales requieren la especificacin de una distribucin deprobabilidad para la poblacin de inters, entonces se har uso de los mtodos paramtricos.Generalmente, la distribucin de probabilidad que se asigna como modelo terico a la v.a. X dependede parmetros que no se conocen y la inferencia estadstica se aplica con el propsito de conocertales parmetros.

    INFERENCIA ESTADSTICA NO PARAMTRICA

    Cuando los procedimientos inferenciales no necesitan considerar un modelo probabilstico o unadistribucin de probabilidad para la poblacin de inters, entonces se har uso de los mtodos no

    paramtricos, conocidos tambin como mtodos de libre distribucin.

    UNIDAD ESTADSTICA

    Es el elemento bsico de la poblacin, del cual se desea obtener informacin. Dependiendo del tipode investigacin, la U.E. puede ser una persona, una familia, una empresa, una institucin, una

    vivienda, una parcela, una maquina, un producto manufacturado, etc. Tambin se le conoce comounidad experimental o unidad de anlisis.

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    2/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 2

    POBLACIN ESTADSTICA

    Es cualquier coleccin o agregacin bien definida de unidades estadsticas, de las cuales deseamoshacer inferencias. El tamao de la poblacin se denota por N. Como ejemplo tenemos la poblacinconformada por los alumnos de la FISI, UNMSM, matriculados en el semestre actual. La poblacin

    debe estar bien definida en cuanto a su contenido y delimitada en el tiempo y en el espacio. En I.E.,generalmente, se representa a la poblacin mediante una v.a. X, la cual tiene una distribucin deprobabilidad fx(x; ). Algunas veces se har referencia a una poblacin de unidades de anlisis (porejemplo: poblacin de alumnos del aula) y otras veces se har referencia a una poblacin demediciones (por ejemplo: poblacin de edades de los alumnos del aula). En inferencia estadstica,nuestra atencin se concentrar en las poblaciones de nmeros. De acuerdo con esto, podemosdefinir una poblacin como el conjunto total de mediciones de inters para determinada variablealeatoria.

    PARMETRO

    Sea la poblacin X1, X2,..., XN. Se llama parmetro a toda funcin matemtica aplicada a lapoblacin. Un parmetro se denota como .

    Ejemplo de parmetro: = =

    N

    i

    i

    Nx

    1

    , la media poblacional.

    Un parmetro describe parcial o completamente- la distribucin de probabilidad de la variable deinters en una poblacin. Por ejemplo, si X es la edad de los alumnos de este curso, no se sabe qudistribucin tiene X pero podra suponerse que las edades siguen una distribucin normal. Siendo los

    parmetros : edad promedio y : varianza de las edades, ambos desconocidos, la distribucinnormal no se encuentra especificada.

    MUESTRA ALEATORIA:

    Intuitivamente, una muestra aleatoria es un subconjunto de la poblacin seleccionado con algnmtodo de muestreo probabilstico.Formalmente, una muestra aleatoria de tamao n, extrada de una poblacin X con funcin dedensidad f(x), es un conjunto de n variables aleatorias X1, X2, , Xn independientes eidnticamente distribuidas, todas con la misma distribucin de X.

    ESTADSTICA:

    Una estadstica T=t(X1, X2, , Xn) es una funcin real de la muestra aleatoria, que no contieneparmetros desconocidos.Ejemplos de estadsticas: la media muestral, la varianza muestral, la proporcin muestral.

    DISTRIBUCIN MUESTRAL:

    Se denomina distribucin muestral a la distribucin de probabilidad de una estadstica, obtenida apartir de todas las posibles muestras de tamao n, elegidas aleatoriamente de una poblacindeterminada.

    La distribucin muestral de una estadstica desempea un papel fundamental en la teora de la

    inferencia estadstica.

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    3/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 3

    ESTIMADOR

    Sea la muestra aleatoria X1, X2,..., Xn. Un estimador es una estadstica que se usa para estimar unparmetro. Un estimador se denota como = T = t(X1, X2,..., Xn).

    Ejemplo de estimador: = X =

    n

    i

    i

    nx

    1

    , la media muestral.

    ESTIMACIN ESTADSTICA

    Es un procedimiento que consiste en utilizar datos muestrales para determinar los valores de losparmetros desconocidos de una poblacin. La estimacin de un parmetro puede hacerse medianteun nico valor (estimacin puntual) o mediante un conjunto de valores (estimacin por intervalo).

    MUESTRA ALEATORIA

    Una muestra aleatoria de tamao n, de una poblacin X, es un conjunto de n unidadesestadsticas, todas ellas elegidas con igual probabilidad y de manera independiente. De maneraequivalente, todas las muestras de tamao ntienen la misma probabilidad de ser seleccionadas.

    OBSERVACIONES:

    1) La definicin anterior equivale a decir que, una muestra aleatoria de tamao n, de X, es unconjunto de n variables aleatorias X1, X2, ..., Xnindependientes e idnticamente distribuidas,todas con la misma distribucin que X.La variable Xidenota el valor numrico del i-simo elemento muestreado.

    2) Si en la poblacin, la media y la varianza de X son

    y 2, respectivamente, entonces cadauna de las variables Xi de la muestra tendr la misma media y la misma varianza

    2.A los parmetros y 2se les llama media poblacional y varianza poblacional,respectivamente. Recordar que, en una poblacin:

    N

    XXX N...21 y 2

    1

    2 )(1

    N

    i

    iXN

    MUESTREO PROBABILSTICO: SELECCIN DE LA MUESTRA

    Obtener una muestra significa que en ella se vean reflejadas todas las caractersticas de la poblacinen estudio. Las principales ventajas de estudiar una poblacin a partir de una muestra son lassiguientes: costo reducido, mayor rapidez, ms exactitud.

    Unidad de muestreo: son colecciones no traslapadas de los elementos de la poblacin que cubren lapoblacin completa.

    Marco muestral: Es una lista de unidades de muestreo.

    MTODOS PROBABILISTICOS DE MUESTREO

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    4/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 4

    MUETREO ALEATORIO SIMPLE (M.A.S.):Un Muestreo Aleatorio Simple es aqul que se formula de modo que todos los elementos de una

    poblacin de tamao N tengan la misma probabilidad de ser incluidos en la muestra de tamao n.En este tipo de muestreo cada muestra de tamao n tiene la misma probabilidad de ser elegida.El M.A.S puede ser de dos formas: sin reposicin y con reposicin.

    El M.A.S generalmente es usado en encuestas de pequea escala.En encuestas de gran escala, el M.A.S es utilizado como parte del diseo de muestreo que es mscomplejo.

    Este tipo de muestreo probabilstico se aplica cuando la poblacin es homognea.

    A cada unidad de muestreo se le asigna un nmero y a travs de un medio ( esferas dentro de una

    urna, tabla de nmeros aleatorios, nmeros aleatorios generados por una calculadora o software

    informtica) se eligen tantos elementos como sean necesarios para completar el tamao de la

    muestra

    MUESTREO SISTEMTICOSe tiene un marco muestral; es decir, una lista con todas las N unidades de muestreo definidas en la

    poblacin (algunas veces ser una lista de N unidades de anlisis). Para extraer la muestrasistemtica de tamao n, se elige un nmero i al azar entre 1 y k , donde k = N/n y los elementos queintegran la muestra son los que ocupan las posiciones i, i+k, i+2k, i+3k, , i+(n -1)k; vale decir, quese seleccionan los elementos de k en kPor ejemplo, si el marco muestral est conformado por 100 unidades de muestreo y se desea unamuestra de tamao 20, entonces se elige al azar un nmero entre 1 y N/n = 5. Supongamos que saleel 4, entonces las unidades que conforman la muestra seran las numeradas con 4, 9, 14, 19, 24, etc.,hasta completar la muestra.

    MUESTREO ESTRATIFICADOUna muestra estratificada es obtenida mediante la separacin de la unidades de muestreo en gruposllamados EstratosLuego se seleccionan muestras aleatorias de cada estrato, mediante una muestreo aleatorio simple oun muestreo aleatorio sistemtico.El tamao de muestra de cada estrato se determina por el mtodo de afijacin proporcional.Seleccin de una muestra estratificada:

    i) Dividir la poblacin en k estratos.Cada estrato consta de Ni unidades muestrales por lo tanto la poblacin tendr

    N=N1+N2+..+Nk unidades muestralesii) Se selecciona una muestra independiente de cada estrato, utilizando cualquier esquema de

    muestreo probabilstico.

    El tamao de muestra de cada estrato est dado por:Donde n es el tamao de la muestra total y ni el tamao de muestra de cada estrato.

    CARACTERSTICAS DE LOS ESTRATOS:Las mediciones dentro de los estratos deben ser homogneas (Baja variabilidad)Las mediciones entre estratos deben ser heterogneas (alta variabilidad)

    MUESTREO POR CONGLOMERADOSEn las encuestas por muestreo a gran escala, las unidades de muestreo suelen ser un grupo deelementos que comnmente es denominado CONGLOMERADO de elementos. Los

    conglomerados son subconjuntos muy similares entre s y al interior de cada uno hay muchadisparidad. El muestreo de estas unidades es llamado Muestreo por Conglomerados.

    N

    N

    nn i

    i

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    5/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 5

    En este caso lo que se busca es una mayor diferencia de medidas dentro del conglomerado y

    menor diferencia entre conglomerados. Para obtener la muestra por este mtodo se seleccionacierto nmero de conglomerados hasta lograr el tamao de la muestra.

    MUESTREO ESTRATIFICADO MUESTREO POR CONGLOMERADO

    DISTRIBUCIONES MUESTRALES

    A partir de una muestra aleatoria X1, X2, ..., Xnse pueden formar otras variables aleatorias,algunas de las cuales juegan un rol muy importante en la inferencia estadstica. Las principalesvariables aleatorias que se pueden obtener a partir de una muestra aleatoria son la media muestral,

    n

    i

    iXX1n

    1 ;lavarianza muestral, 2

    1

    2 )(1

    1XX

    nS

    n

    i

    i

    y laproporcin muestral ; estas

    variables son comnmente conocidas como estadsticas muestrales.A las distribuciones de probabilidad de cada una de estas estadsticas muestrales se les llama

    distribuciones muestrales. As tenemos por ejemplo, la distribucin muestral de la mediamuestral X .

    Ejemplo: Con el siguiente ejemplo hipottico construiremos la distribucin muestral de la mediamuestral X . Consideremos la siguiente poblacin de 5 ingresos anuales, en soles, de un grupo detrabajadores de una empresa: {20, 40, 60, 80, 100}. La media poblacional de los puntajes es

    5

    .. . 521 XXX = 60 y la varianza poblacional es 25

    1

    2 )(5

    1

    iiX = 800.

    Si de esta poblacin se extraen muestras aleatorias de tamao 2, el nmero total de posibles muestrases 25, las cuales se detallan a continuacin:

    (20,20) (40,20) (60,20) (80,20) (100,20)(20,40) (40,40) (60,40) (80,40) (100,40)(20,60) (40,60) (60,60) (80,60) (100,60)(20,80) (40,80) (60,80) (80,80) (100,80)(20,100) (40, 100) (60,100) (80, 100) (100,100)

    Todas estas muestras son igualmente probables, con probabilidad igual a 1/25.

    En cada muestra se calcula la media muestral X . Estas medias son, respectivamente:

    POBLACIN

    ESTRATOS

    MUESTRA

    POBLACIN

    conglomerados

    MUESTRA

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    6/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 6

    20 30 40 50 6030 40 50 60 7040 50 60 70 8050 60 70 80 9060 70 80 90 100

    Ahora, tomando en cuenta estos 25 valores de medias muestrales, construyamos la distribucin defrecuencias relativas o, lo que es lo mismo, la distribucin de probabilidad:

    x : 20 30 40 50 60 70 80 90 100p(x ): 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25

    Esta distribucin de probabilidad constituye la distribucin muestral de la media muestral, de este

    ejemplo hipottico.Si a partir de esta distribucin de medias calculamos la esperanza y la varianza, los valores de estos

    parmetros son, respectivamente, X = )(xpx = 60 y )()(22

    xpx xx = 400.La media muestral es la estadstica muestral ms importante y es utilizada con mucha

    frecuencia en problemas de toma de decisiones para medias poblacionales desconocidas.

    DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X CUANDO EL MUESTREOSE HACE DESDE CUALQUIER POBLACIN

    Es la distribucin de probabilidad de la media muestral obtenida a partir de todas las posibles

    muestras de tamao n extradas de una poblacin.

    Siendo X una funcin de variables aleatorias independientes e idnticamente distribuidas, tambines una variable aleatoria. El valor esperado y la varianza de X son, respectivamente, E( X ) = y

    Var( X ) = 2

    n.

    Este resultado es vlido cualquiera que sea la distribucin de probabilidad de donde se obtuvo lamuestra.En el ejemplo arriba citado, utilizando la distribucin de la media muestral se obtiene: E( X )= 60 =

    y Var(X ) = 400 =2

    n, cumplindose lo afirmado.

    EL TEOREMA DEL LIMITE CENTRAL

    Este teorema informa acerca de la distribucin muestral de medias, de muestras de tamao n.Recurdese que bsicamente existen tres tipos de informacin que se desea conocer sobre unadistribucin: (1) dnde est el centro, (2) qu tanto vara, y (3) cmo est repartida. El Teorema delLmite Central proporciona informacin sobre estos tres aspectos.

    Teorema del Lmite Central

    Si se toman todas las posibles muestras de tamao n , de una poblacin con media y varianza2,entonces la distribucin muestral de las medias

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    7/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 7

    1. tendr una media, x, igual a ,

    2. tendr una varianza, x

    2, igual a2

    n,

    3.ser de tipo aproximadamente normal, an cuando la distribucin de donde proceden las

    muestras no sea normal. La aproximacin mejora cuando aumenta el tamao de la muestra (n 30) .

    Podemos resumir la importancia de este teorema del modo siguiente: cualqu iera que sea ladistr ibucin de la poblacin de donde provienen las muestras (no necesariamente normal), la

    media muestral tendr una distribucin que se comporta como una normal, siempre que el

    tamao de la muestr a sea gr ande.

    Si la muestra proviene de una poblacin normal, la media muestral tendr distribucinnormal, an cuando la muestra no sea grande.

    De acuerdo con este teorema, si X (, 2

    n) entonces la v.a. Z =

    x

    n

    N (0,1).

    Notar que, la desviacin estndar de la media muestral es igual an

    , y es una medida de la

    dispersin de la misma; vemos que la dispersin decrece conforme n crece.A la desviacin estndar de la media muestral se le conoce tambin como err or estndar de lamedia.

    APLICACIONES DEL TLCPuesto que las medias estn distribuidas de manera aproximadamente normal, puede utilizarse latabla normal para el clculo de probabilidades.

    Ejemplo 1Sea una poblacin normal con = 100 y2 = 400. si se selecciona aleatoriamente una muestra detamao 16, cul es la probabilidad de que la media muestral vare entre 90 y 110? Es decir, cuntovale P (90

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    8/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 8

    Ejemplo 2El ministerio de trabajo informa que en promedio los obreros estatales ganan 500 soles con unadesviacin estndar de 20 soles. Si se toma una muestra aleatoria de 81 obreros, qu probabilidadhay de que la media de los 81 salarios sea menor que 450 soles?

    Solucin:Sea la v.a. X : salarios de los obreros estatales. No se conoce la distribucin de X. Pero, como eltamao de la muestra es grande, de acuerdo al TLC, la media muestral de los 81 salarios tendraproximadamente distribucin normal con una media de 500 soles y una varianza igual a (20) 2/81 =4.94; esto es, X N(500, 4.94).Se pide P(X< 450). Estandarizando Xse tiene:

    P(X

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    9/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 9

    Solucin:Como cada Xitiene distribucin normal con media 500 y varianza 400, para i=1,2,...,25, entonces lamedia muestral X tiene distribucin normal con media 500 y varianza 400/25 = 16.P(detencin del proceso) = 1 - P(490 < X < 510) = 1 - P(-2.5

  • 8/13/2019 Clase 9 Muestreo y Distribuciones Muestrales

    10/10

    UNMSMFISIEAPIS - CURSO: ESTADSTICA IISEMESTRE ACADMICO 2013-2

    PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 10

    DISTRIBUCIN MUESTRAL DE LA MEDIA MUESTRAL X CUANDO SE HACE ELMUESTREO DESDE UNA POBLACIN NORMAL CON VARIANZA DESCONOCIDA

    Teorema 3: Sea una muestra aleatoria X X Xn1 2, ,..., obtenida de una poblacin normal con media

    y varianza 2 desconocida. Sean X y S2 la media y la varianza muestral. Entonces la variablealeatoria

    T =x

    s n

    tiene una distribucin t con parmetro n-1.

    DISTRIBUCIN MUESTRAL DE LA PROPORCION MUESTRAL p CUANDO ELMUESTREO SE HACE DESDE UNA POBLACIN DE BERNOULLI

    Consideremos una poblacin en donde existe una proporcinp de elementos con el atributo A.Si de esta poblacin se toma una muestra aleatoria de n elementos, la proporcin de elementos quetienen el atributo A en la muestra, p , corresponde a una variable aleatoria que se llama proporcinmuestr al de tamao n.

    Teorema 4: Sea una muestra aleatoria X X Xn1 2, ,..., obtenida de una poblacin de Bernoulli conmedia p y varianza )1( pp . Entonces la proporcin muestral, que tiene las mismas caractersticasde la media muestral, cumple las propiedades siguientes:

    a) E( p ) =p

    b) Var(p

    ) =p(1-p) / nc) Cuando el tamao de la muestra es suficientemente grande, la distribucin de la variable aleatoria

    npp

    pp

    /)1(

    se aproxima a la distribucin normal estndar, debido al teorema del lmite central.

    (La aproximacin mejora si 30n )

    Todas las distribuciones muestrales que hemos visto juegan un rol muy importante en el proceso deinferencia estadstica.