Tema 10 Estimación de Parámetros Poblacionales (25!03!15)

1

Grupo 38: Natalia Montero, Amaia Longo y Yanire Rojo. 25/03/15

TEMA 10 ESTIMACIN DE PARMETROS POBLACIONALES

Tras haber visto lo que es el error aleatorio (en el tema anterior) vamos a ver como se

construye un intervalo de confianza.

Para ello antes de explicar cmo se construyen vamos a volver a ver el esquema general de

inferencia estadstica. En el observamos la poblacin objetivo que tiene unos parmetros

(mu, sigma, p...), sus variables de inters, su tamao y escogemos la muestra. Una muestra la

cual consta de varios individuos y cada uno de estos individuos tiene una variable y esa tiene la

misma distribucin que tenga X en la poblacin objetivo (como ya dijimos anteriormente).

Ahora calculamos los estadsticos la media muestral, la proporcin muestral, la desviacin

estndar y el resto de estadsticos que se pueden calcular. Tras esto vamos a hacer inferencia,

es decir, dar el salto de la muestra a la poblacin objetivo, para ello crearemos intervalos de

confianza.

Se trata de a partir de los resultados de la muestra construir un intervalo de confianza para el

parmetro con una confianza de que contenga el parmetro que yo quiero estimar.

Si yo calculo la media muestral la calcular para estimar que es la media de la poblacin

objetivo. Por lo tanto quiero hacer un intervalo de confianza basado en esta media muestral

que contenga al parmetro .

Por otro lado, si yo calculo la proporcin muestral es porque quiero acercarme al verdadero

valor de la proporcin en la poblacin objetivo, as que al igual que con la media muestral pero

en este caso con la proporcin muestral establecer un intervalo de confianza para que

contenga al verdadero valor p de la poblacin objetivo.

Conclusin: Un intervalo de confianza es aquel que se construye a partir de la media o

proporcin muestral, de manera que posea una probabilidad importante de contener el

verdadero valor que quiero estimar ( o p de la poblacin objetivo).

2

Vamos a ver de qu forma podemos hacer eso:

Hacemos una estimacin de la media en la poblacin objetivo, esta se puede llevar a cabo

de dos formas:

Si es conocida (poco frecuente), recordamos que es la desviacin estandar

(tambin conocido como error estandar). Yo en la poblacin objetivo tengo una

variable X (en la poblacin objetivo) que sigue una distribucin normal de media de

X y de desviacin estndar de X. En este caso supongo que conozco la distribucin

que es normal pero desconozco el valor de la media. De esta poblacin objetivo

seleccionamos una muestra y vamos a tener la variable X en cada uno de los

individuos. De cada una de estas variables solamente obtengo una medida x1, x2 xn

y construyo la media muestral (la suma de todas las x dividido entre n).

Cul es la distribucin de la media muestral? No hace falta aplicar el teorema del

lmite central porque en este caso ya sabemos que X es normal, por lo tanto la media

de la muestra es tambin normal. Sabemos que tiene la

misma media que X en la poblacin objetivo ( de X) y la

desviacin estndar de la media muestral ser la desviacin

estndar de la poblacin objetivo partido de la raz de n (siendo n el tamao muestral).

Para construir el intervalo de confianza yo quiero que mi estimacin (x raya) se separe

del verdadero valor ( de X) menos de un valor concreto

de error aleatorio.

Quiero que esta diferencia de mi estimador frente al parmetro que quiero estimar

sea menos de psilon o menos psilon (ya que las diferencias pueden ser positivas o

negativas). Pero yo quiero conseguir que ocurra esto con una determinada

probabilidad, esa probabilidad es denominada alfa. Es la probabilidad de que mi

estimador se separe menos del parmetro y que

esa separacin este entre menos psilon y mas

psilon.

Adems si cambiamos los signos entonces tendramos la otra probabilidad 1-alfa, la

cual es la probabilidad de que la media

muestral (X raya) se separe del verdadero

valor ( de x) menos de psilon o menos psilon.

Al final lo que yo voy a decir es que quiero un valor de la media muestral menos

psilon y otro valor de la media muestral mas psilon que entre ambos se encuentre el

verdadero valor de x y quiero que ocurra

con una determinada probabilidad que ser

1- alfa.

Nivel de confianza del intervalo: Es 1-alfa.

NOTA: Yo voy a utilizar la distribucin de la media muestral para aproximarme a .

EJEMPLO

Imaginad que tengo un individuo determinado con una media mu desconocida para

estimarla se toman n medidas independientes sobre dicha presin arterial. Resultando

una media muestral de 121,5 mmHg. Sigma es conocida y se tratara de 10 mmHg.

Lo que se nos pide es estimar mu mediante un intervalo de confianza al 95%.

3

1. Si n es 100:

Tenemos una muestra de un nico individuo, pero ese individuo puede tener

distintos valores de presin arterial y yo quiero saber cul es la media de su

presin arterial, entonces cojo una serie de medidas independientes de dicha

presin arterial (nos dice que son independientes, ya que si no nosotros

supondramos la existencia de correlacin debido a que al individuo le

hacemos distintas medidas). Las medidas que hemos hecho sobre este

individuo se encuentran lo suficientemente separadas en el tiempo como para

que sean independientes. Vamos a tomar primero 100 medidas de presin

arterial de este individuo suficientemente separadas y lo que me va a dar de

media en esta muestra es 121,5. As que ahora yo tengo una poblacin

objetivo, en la cual existe un individuo que tiene una variable X que es la

presin arterial, la cual posee una media y una desviacin estndar que en

este caso conocemos, de hecho es de 10 mmHg. La distribucin (a veces) y la

media de la poblacin objetivo son desconocidas, por el contrario sabemos

que sigma tiene un valor de 10 mmHg. La poblacin es inabarcable as que

tomar una muestra de esta que sea representativa y con un tamao

muestral de n medidas o individuos (dependiendo de cmo sea la poblacin).

Entonces vamos a tener las distintas medidas, a partir de ellas calculamos la

media muestral (la media muestral hay que tener en cuenta que tomara

diferentes valores en cada posible muestra de n medidas). Nos interesa saber

cul es la distribucin de la media muestral:

a) Si X sigue una distribucin normal de media y de desviacin

estndar 10 mmHg entonces la media muestral sigue esta distribucin.

Es como esta pero ahora desviacin estndar de la media muestral

sera 10 partido de la raz cuadrada de n. La raz de 100 que es el

tamao de la muestra nos da un valor de 10. Por lo tanto 10/10=1, con

lo que desciframos que la desviacin estndar de la media muestral es

1.

b) Si X sigue una distribucin desconocida en la poblacin objetivo la

distribucin sera desconocida con la misma media y con la desviacin

estndar de 10. Si sigma es conocida (como en este caso) y n (el

tamao muestral) es grande podemos decir que la media muestral

sigue una distribucin aproximadamente normal de media y de

desviacin estndar sigma partido de la raz cuadrada de n.

Si ahora hacemos la estandarizacin y la asignacin del nivel de confianza del 95%

estaramos haciendo esto: Yo quera que mi estimacin X raya se separara del

verdadero valor menos de ms psilon y menos psilon, es decir, que estuviera entre

menos psilon y ms psilon. Lo que hago es dividir toda esa expresin entre el error

estndar de la media muestral, si hago esto esta variable es la variable normal

estndar y estoy diciendo que quiero que mi media se separe del verdadero valor mu

menos de psilon con una probabilidad del 0,95. Esto es a lo que se le llama hacer

inferencia mediante intervalos de confianza.

4

Nota: psilon es el error aleatorio.

Vamos a ver como trabajamos con las distribuciones:

Tenemos la media de X y sigma conocida.

La distribucin X en la poblacin objetivo sera normal de x y sigma de x, siendo

sigma de x conocida (10mmHg), la distribucin de la media muestral va a tener la

misma media de X pero la desviacin estndar ser sigma de x partido de la raz

cuadrada de n, su campana ser ms afilada ye en conjunto esta ltima

distribucin de la media muestral ser ms estrecha, debido a que la desviacin

estndar se encuentra partida por la raz cuadrada de n.

Quiero que X raya se separe del verdadero valor de x menos ms psilon o menos

psilon, y la probabilidad con la que lo quiero conseguir es de uno menos alfa.

La diferencia (entre X raya y de X) es el error aleatorio, por lo tanto esta variable es

el error aleatorio, marco dos puntos y entre ellos quiero abarcar una probabilidad 1

menos alfa. Si quiero hacer esto en la

distribucin normal estndar (este

punto y este otro) estn fijos y son

conocidos es lo que yo voy a utilizar

me voy a ir a la distribucin

normal estndar y voy a decir quiero

un nivel de confianza de 1- alfa por lo

tanto (por el lado izquierdo) en violeta voy a tener alfa medios y por el lado derecho

otros alfa medios.

En conclusin yo tengo aqu un intervalo de confianza, quiero que la probabilidad de

que mi estimacin se separe del verdadero valor de la poblacin objetivo entre ms

psilon y menos psilon sea 1-alfa (luego

lo estandarizo). Quiero que 1- alfa quede

dentro del intervalo, se trata entonces de

conocer cules son los intervalos de

confianza y los 1-alfa que puedo utilizar.

5

Los niveles de confianza que yo puedo fijar para un intervalo de confianza (que son bastante

estndares) son:

I. Al 90%, entonces el valor fijo de la izquierda ser -1,64 porque en el

centro quiero dejar el 90%, para que sea as el valor de la izquierda

tiene que ser -1,64 y el de la derecha +1,64.

II. Al 95% quiere decir que queremos dejar en el centro el 95% de la

probabilidad entonces entre las dos olas dejars el 5% (0,025 por un

lado y 0,025 por el otro). Entonces los valores fijos en este caso sern

a la izquierda -1,96 y a la derecha +1,96.

III. Si lo quieres al 99% la probabilidad es del 0,99 los valores de los lados

sern en este caso a la izquierda -2,58 y a la derecha +2,58.

Ejemplo: Si quiero saber cuntas personas han votado a partido poltico y quiero estar

seguro de que el valor se encuentre en mi intervalo lo que hare ser hacer un intervalo

del 99% lo que pasa es que ser muy amplio, puedo hacer uno del 90% que ser ms

estrecho si pero no me aseguro de que ese intervalo contenga el valor que yo deseo

saber. Siempre es un balance.

Luego esto es simplemente decirla a STATA que quiero un intervalo de dicho

porcentaje, pero conviene saber que estamos haciendo.

Si yo quiero controlar el error aleatorio (psilon):

En el caso de que coja un intervalo de confianza al 95% este valor es de 1,96 (como ya

hemos dicho), si sabemos ese dato, conocemos sigma (10 mmHg en este caso) y

conocemos el tamao muestral (100) entonces podemos calcular el error aleatorio

(despejando en la siguiente formula):

Importante: Si queremos disminuir el error aleatorio, es decir, si quiero acercarme al

parmetro con mucha precisin (la precisin implica ausencia de error aleatorio, es

decir, que sean pequeos) tendremos que incrementar n. Cuanto ms incrementemos

n el error estndar de la media muestral va a disminuir y tambin el error aleatorio.

Recordatorio: la validez implica ausencia de error sistemtico, es decir, que sean

pequeos.

6

Tpica pregunta de MIR: Qu podemos hacer para disminuir el error aleatorio de un

estudio? El error aleatorio est relacionado con la precisin, y esta aumenta cuando

disminuimos el error aleatorio y para disminuir a este ltimo debemos incrementar el

tamao de la muestra. Por lo que cuanto ms grande sea el tamao de la muestra ms

preciso es el estudio ya que menor error aleatorio y esto tiene que ver con la calidad

de los estudios.

Si es desconocida que es lo ms frecuente (esto no lo vamos a dar).

En el caso de las proporciones ocurre lo mismo, si queremos un nivel de confianza del 90%

habra que fijar los valores de 1,64-1,96-2,58 respectivamente (son los mismos valores que en

las medias).

Para construir el intervalo de confianza:

Para variables continuas se coge la media muestral y se le suma o resta el error aleatorio (el

cual debemos despejar, para ello multiplicamos al error estndar (sigma partido de la raz

cuadrada de n) por el nmero que corresponda al porcentaje del intervalo de confianza que

deseamos (Z), si se trata de una distribucin normal cogemos uno de estos puntos 1,96, lo

mencionado anteriormente). Para sacar el error estndar si sigma es conocido simplemente se

calcula sustituyendo los valores, en el caso de que sigma sea un valor desconocido tendr que

estimarla en la muestra y multiplicarlo por Z. Si tenemos menos de 30 individuos en la

muestra tendremos que coger esos valores de la t de student.

RESUMEN:

media ( ) +/- el error estndar = intervalo de confianza

proporcin muestral +/- el error estndar = intervalo de confianza para la proporcin.

ATENTOS A LAS DIAPOSITIVAS DEL POWER POINT DE ESTE TEMA, EL CUAL EN EGELA ES

NUMERADO COMO TEMA 9 PERO CONTIENE EL MISMO TTULO QUE ESTE ARCHIVO. DEBIDO

A QUE ALGUNAS NO LAS HA EXPLICADO EN CLASE.

Tema 10 Estimación de Parámetros Poblacionales (25!03!15)

Documents

Transcript of Tema 10 Estimación de Parámetros Poblacionales (25!03!15)