Tema 10 Estimación de Parámetros Poblacionales (25!03!15)

6
1 Grupo 38: Natalia Montero, Amaia Longo y Yanire Rojo. 25/03/15 TEMA 10 ESTIMACIÓN DE PARÁMETROS POBLACIONALES Tras haber visto lo que es el error aleatorio (en el tema anterior) vamos a ver como se construye un intervalo de confianza. Para ello antes de explicar cómo se construyen vamos a volver a ver el esquema general de inferencia estadística. En el observamos la población objetivo que tiene unos parámetros (mu, sigma, p...), sus variables de interés, su tamaño y escogemos la muestra. Una muestra la cual consta de varios individuos y cada uno de estos individuos tiene una variable y esa tiene la misma distribución que tenga X en la población objetivo (como ya dijimos anteriormente). Ahora calculamos los estadísticos la media muestral, la proporción muestral, la desviación estándar y el resto de estadísticos que se pueden calcular. Tras esto vamos a hacer inferencia, es decir, dar el salto de la muestra a la población objetivo, para ello crearemos intervalos de confianza. Se trata de a partir de los resultados de la muestra construir un intervalo de confianza para el parámetro con una confianza de que contenga el parámetro que yo quiero estimar. Si yo calculo la media muestral la calcularé para estimar μ que es la media de la población objetivo. Por lo tanto quiero hacer un intervalo de confianza basado en esta media muestral que contenga al parámetro μ. Por otro lado, si yo calculo la proporción muestral es porque quiero acercarme al verdadero valor de la proporción en la población objetivo, así que al igual que con la media muestral pero en este caso con la proporción muestral estableceré un intervalo de confianza para que contenga al verdadero valor p de la población objetivo. Conclusión: Un intervalo de confianza es aquel que se construye a partir de la media o proporción muestral, de manera que posea una probabilidad importante de contener el verdadero valor que quiero estimar (μ o p de la población objetivo).

description

Comi

Transcript of Tema 10 Estimación de Parámetros Poblacionales (25!03!15)

  • 1

    Grupo 38: Natalia Montero, Amaia Longo y Yanire Rojo. 25/03/15

    TEMA 10 ESTIMACIN DE PARMETROS POBLACIONALES

    Tras haber visto lo que es el error aleatorio (en el tema anterior) vamos a ver como se

    construye un intervalo de confianza.

    Para ello antes de explicar cmo se construyen vamos a volver a ver el esquema general de

    inferencia estadstica. En el observamos la poblacin objetivo que tiene unos parmetros

    (mu, sigma, p...), sus variables de inters, su tamao y escogemos la muestra. Una muestra la

    cual consta de varios individuos y cada uno de estos individuos tiene una variable y esa tiene la

    misma distribucin que tenga X en la poblacin objetivo (como ya dijimos anteriormente).

    Ahora calculamos los estadsticos la media muestral, la proporcin muestral, la desviacin

    estndar y el resto de estadsticos que se pueden calcular. Tras esto vamos a hacer inferencia,

    es decir, dar el salto de la muestra a la poblacin objetivo, para ello crearemos intervalos de

    confianza.

    Se trata de a partir de los resultados de la muestra construir un intervalo de confianza para el

    parmetro con una confianza de que contenga el parmetro que yo quiero estimar.

    Si yo calculo la media muestral la calcular para estimar que es la media de la poblacin

    objetivo. Por lo tanto quiero hacer un intervalo de confianza basado en esta media muestral

    que contenga al parmetro .

    Por otro lado, si yo calculo la proporcin muestral es porque quiero acercarme al verdadero

    valor de la proporcin en la poblacin objetivo, as que al igual que con la media muestral pero

    en este caso con la proporcin muestral establecer un intervalo de confianza para que

    contenga al verdadero valor p de la poblacin objetivo.

    Conclusin: Un intervalo de confianza es aquel que se construye a partir de la media o

    proporcin muestral, de manera que posea una probabilidad importante de contener el

    verdadero valor que quiero estimar ( o p de la poblacin objetivo).

  • 2

    Vamos a ver de qu forma podemos hacer eso:

    Hacemos una estimacin de la media en la poblacin objetivo, esta se puede llevar a cabo

    de dos formas:

    Si es conocida (poco frecuente), recordamos que es la desviacin estandar

    (tambin conocido como error estandar). Yo en la poblacin objetivo tengo una

    variable X (en la poblacin objetivo) que sigue una distribucin normal de media de

    X y de desviacin estndar de X. En este caso supongo que conozco la distribucin

    que es normal pero desconozco el valor de la media. De esta poblacin objetivo

    seleccionamos una muestra y vamos a tener la variable X en cada uno de los

    individuos. De cada una de estas variables solamente obtengo una medida x1, x2 xn

    y construyo la media muestral (la suma de todas las x dividido entre n).

    Cul es la distribucin de la media muestral? No hace falta aplicar el teorema del

    lmite central porque en este caso ya sabemos que X es normal, por lo tanto la media

    de la muestra es tambin normal. Sabemos que tiene la

    misma media que X en la poblacin objetivo ( de X) y la

    desviacin estndar de la media muestral ser la desviacin

    estndar de la poblacin objetivo partido de la raz de n (siendo n el tamao muestral).

    Para construir el intervalo de confianza yo quiero que mi estimacin (x raya) se separe

    del verdadero valor ( de X) menos de un valor concreto

    de error aleatorio.

    Quiero que esta diferencia de mi estimador frente al parmetro que quiero estimar

    sea menos de psilon o menos psilon (ya que las diferencias pueden ser positivas o

    negativas). Pero yo quiero conseguir que ocurra esto con una determinada

    probabilidad, esa probabilidad es denominada alfa. Es la probabilidad de que mi

    estimador se separe menos del parmetro y que

    esa separacin este entre menos psilon y mas

    psilon.

    Adems si cambiamos los signos entonces tendramos la otra probabilidad 1-alfa, la

    cual es la probabilidad de que la media

    muestral (X raya) se separe del verdadero

    valor ( de x) menos de psilon o menos psilon.

    Al final lo que yo voy a decir es que quiero un valor de la media muestral menos

    psilon y otro valor de la media muestral mas psilon que entre ambos se encuentre el

    verdadero valor de x y quiero que ocurra

    con una determinada probabilidad que ser

    1- alfa.

    Nivel de confianza del intervalo: Es 1-alfa.

    NOTA: Yo voy a utilizar la distribucin de la media muestral para aproximarme a .

    EJEMPLO

    Imaginad que tengo un individuo determinado con una media mu desconocida para

    estimarla se toman n medidas independientes sobre dicha presin arterial. Resultando

    una media muestral de 121,5 mmHg. Sigma es conocida y se tratara de 10 mmHg.

    Lo que se nos pide es estimar mu mediante un intervalo de confianza al 95%.

  • 3

    1. Si n es 100:

    Tenemos una muestra de un nico individuo, pero ese individuo puede tener

    distintos valores de presin arterial y yo quiero saber cul es la media de su

    presin arterial, entonces cojo una serie de medidas independientes de dicha

    presin arterial (nos dice que son independientes, ya que si no nosotros

    supondramos la existencia de correlacin debido a que al individuo le

    hacemos distintas medidas). Las medidas que hemos hecho sobre este

    individuo se encuentran lo suficientemente separadas en el tiempo como para

    que sean independientes. Vamos a tomar primero 100 medidas de presin

    arterial de este individuo suficientemente separadas y lo que me va a dar de

    media en esta muestra es 121,5. As que ahora yo tengo una poblacin

    objetivo, en la cual existe un individuo que tiene una variable X que es la

    presin arterial, la cual posee una media y una desviacin estndar que en

    este caso conocemos, de hecho es de 10 mmHg. La distribucin (a veces) y la

    media de la poblacin objetivo son desconocidas, por el contrario sabemos

    que sigma tiene un valor de 10 mmHg. La poblacin es inabarcable as que

    tomar una muestra de esta que sea representativa y con un tamao

    muestral de n medidas o individuos (dependiendo de cmo sea la poblacin).

    Entonces vamos a tener las distintas medidas, a partir de ellas calculamos la

    media muestral (la media muestral hay que tener en cuenta que tomara

    diferentes valores en cada posible muestra de n medidas). Nos interesa saber

    cul es la distribucin de la media muestral:

    a) Si X sigue una distribucin normal de media y de desviacin

    estndar 10 mmHg entonces la media muestral sigue esta distribucin.

    Es como esta pero ahora desviacin estndar de la media muestral

    sera 10 partido de la raz cuadrada de n. La raz de 100 que es el

    tamao de la muestra nos da un valor de 10. Por lo tanto 10/10=1, con

    lo que desciframos que la desviacin estndar de la media muestral es

    1.

    b) Si X sigue una distribucin desconocida en la poblacin objetivo la

    distribucin sera desconocida con la misma media y con la desviacin

    estndar de 10. Si sigma es conocida (como en este caso) y n (el

    tamao muestral) es grande podemos decir que la media muestral

    sigue una distribucin aproximadamente normal de media y de

    desviacin estndar sigma partido de la raz cuadrada de n.

    Si ahora hacemos la estandarizacin y la asignacin del nivel de confianza del 95%

    estaramos haciendo esto: Yo quera que mi estimacin X raya se separara del

    verdadero valor menos de ms psilon y menos psilon, es decir, que estuviera entre

    menos psilon y ms psilon. Lo que hago es dividir toda esa expresin entre el error

    estndar de la media muestral, si hago esto esta variable es la variable normal

    estndar y estoy diciendo que quiero que mi media se separe del verdadero valor mu

    menos de psilon con una probabilidad del 0,95. Esto es a lo que se le llama hacer

    inferencia mediante intervalos de confianza.

  • 4

    Nota: psilon es el error aleatorio.

    Vamos a ver como trabajamos con las distribuciones:

    Tenemos la media de X y sigma conocida.

    La distribucin X en la poblacin objetivo sera normal de x y sigma de x, siendo

    sigma de x conocida (10mmHg), la distribucin de la media muestral va a tener la

    misma media de X pero la desviacin estndar ser sigma de x partido de la raz

    cuadrada de n, su campana ser ms afilada ye en conjunto esta ltima

    distribucin de la media muestral ser ms estrecha, debido a que la desviacin

    estndar se encuentra partida por la raz cuadrada de n.

    Quiero que X raya se separe del verdadero valor de x menos ms psilon o menos

    psilon, y la probabilidad con la que lo quiero conseguir es de uno menos alfa.

    La diferencia (entre X raya y de X) es el error aleatorio, por lo tanto esta variable es

    el error aleatorio, marco dos puntos y entre ellos quiero abarcar una probabilidad 1

    menos alfa. Si quiero hacer esto en la

    distribucin normal estndar (este

    punto y este otro) estn fijos y son

    conocidos es lo que yo voy a utilizar

    me voy a ir a la distribucin

    normal estndar y voy a decir quiero

    un nivel de confianza de 1- alfa por lo

    tanto (por el lado izquierdo) en violeta voy a tener alfa medios y por el lado derecho

    otros alfa medios.

    En conclusin yo tengo aqu un intervalo de confianza, quiero que la probabilidad de

    que mi estimacin se separe del verdadero valor de la poblacin objetivo entre ms

    psilon y menos psilon sea 1-alfa (luego

    lo estandarizo). Quiero que 1- alfa quede

    dentro del intervalo, se trata entonces de

    conocer cules son los intervalos de

    confianza y los 1-alfa que puedo utilizar.

  • 5

    Los niveles de confianza que yo puedo fijar para un intervalo de confianza (que son bastante

    estndares) son:

    I. Al 90%, entonces el valor fijo de la izquierda ser -1,64 porque en el

    centro quiero dejar el 90%, para que sea as el valor de la izquierda

    tiene que ser -1,64 y el de la derecha +1,64.

    II. Al 95% quiere decir que queremos dejar en el centro el 95% de la

    probabilidad entonces entre las dos olas dejars el 5% (0,025 por un

    lado y 0,025 por el otro). Entonces los valores fijos en este caso sern

    a la izquierda -1,96 y a la derecha +1,96.

    III. Si lo quieres al 99% la probabilidad es del 0,99 los valores de los lados

    sern en este caso a la izquierda -2,58 y a la derecha +2,58.

    Ejemplo: Si quiero saber cuntas personas han votado a partido poltico y quiero estar

    seguro de que el valor se encuentre en mi intervalo lo que hare ser hacer un intervalo

    del 99% lo que pasa es que ser muy amplio, puedo hacer uno del 90% que ser ms

    estrecho si pero no me aseguro de que ese intervalo contenga el valor que yo deseo

    saber. Siempre es un balance.

    Luego esto es simplemente decirla a STATA que quiero un intervalo de dicho

    porcentaje, pero conviene saber que estamos haciendo.

    Si yo quiero controlar el error aleatorio (psilon):

    En el caso de que coja un intervalo de confianza al 95% este valor es de 1,96 (como ya

    hemos dicho), si sabemos ese dato, conocemos sigma (10 mmHg en este caso) y

    conocemos el tamao muestral (100) entonces podemos calcular el error aleatorio

    (despejando en la siguiente formula):

    Importante: Si queremos disminuir el error aleatorio, es decir, si quiero acercarme al

    parmetro con mucha precisin (la precisin implica ausencia de error aleatorio, es

    decir, que sean pequeos) tendremos que incrementar n. Cuanto ms incrementemos

    n el error estndar de la media muestral va a disminuir y tambin el error aleatorio.

    Recordatorio: la validez implica ausencia de error sistemtico, es decir, que sean

    pequeos.

  • 6

    Tpica pregunta de MIR: Qu podemos hacer para disminuir el error aleatorio de un

    estudio? El error aleatorio est relacionado con la precisin, y esta aumenta cuando

    disminuimos el error aleatorio y para disminuir a este ltimo debemos incrementar el

    tamao de la muestra. Por lo que cuanto ms grande sea el tamao de la muestra ms

    preciso es el estudio ya que menor error aleatorio y esto tiene que ver con la calidad

    de los estudios.

    Si es desconocida que es lo ms frecuente (esto no lo vamos a dar).

    En el caso de las proporciones ocurre lo mismo, si queremos un nivel de confianza del 90%

    habra que fijar los valores de 1,64-1,96-2,58 respectivamente (son los mismos valores que en

    las medias).

    Para construir el intervalo de confianza:

    Para variables continuas se coge la media muestral y se le suma o resta el error aleatorio (el

    cual debemos despejar, para ello multiplicamos al error estndar (sigma partido de la raz

    cuadrada de n) por el nmero que corresponda al porcentaje del intervalo de confianza que

    deseamos (Z), si se trata de una distribucin normal cogemos uno de estos puntos 1,96, lo

    mencionado anteriormente). Para sacar el error estndar si sigma es conocido simplemente se

    calcula sustituyendo los valores, en el caso de que sigma sea un valor desconocido tendr que

    estimarla en la muestra y multiplicarlo por Z. Si tenemos menos de 30 individuos en la

    muestra tendremos que coger esos valores de la t de student.

    RESUMEN:

    media ( ) +/- el error estndar = intervalo de confianza

    proporcin muestral +/- el error estndar = intervalo de confianza para la proporcin.

    ATENTOS A LAS DIAPOSITIVAS DEL POWER POINT DE ESTE TEMA, EL CUAL EN EGELA ES

    NUMERADO COMO TEMA 9 PERO CONTIENE EL MISMO TTULO QUE ESTE ARCHIVO. DEBIDO

    A QUE ALGUNAS NO LAS HA EXPLICADO EN CLASE.