Estimacion de-parametros

Post on 25-Jun-2015

461 views 4 download

Transcript of Estimacion de-parametros

Estimación de parámetros poblacionales

Sumario

• Estimación puntual.• Estimación por intervalos de confianza.

– De una media poblacional ( ) • con conocida .• desconocida.

– De una proporción poblacional ( P )

• Presición y confiabilidad de una estimación por intervalo.

• El tamaño de la muestra en función de la precisión y confiabilidad de la estimación.

Estimación estadística

• Operación que determina un valor numérico de un parámetro que caracteriza una población a partir del valor numérico de ese parámetro en una muestra

Estimación puntual

• Estamos interesados en realizar un estudio para describir las características del desarrollo físico en niñas cubanas entre 8 y 9 años de edad, por medio de la observación de algunas dimensiones antropométricas.

Estimación puntual• La variable X (talla) se distribuye normal en la

población cuyos parámetros µ y , se desconocen, lo expresado es común escribirlo en la notación:

X N (, )

X se distribuye normal con media poblacional µ y desviación estándar poblacional .

Estimación puntual• Para continuar se ha tomado una muestra de

tamaño n = 90 y queremos estimar la talla media y la desviación estándar.

• x1, x2, x3,..., xnn

i1 2 3 ni=1

xX +X +X +...+X

X=n n

n 2

2 2 2 2i2 1 2 3 ni=1

x -x(X -X) +(X -X) +(X -X) +...+(X -X)

S = =n-1 n-1

2S= S

Estimación puntual• Si al realizar los cálculos apropiados se obtiene

que:

entonces esas cifras son las estimaciones de la media y la desviación estándar poblacionales, o sea, de y .

.X 126 9 cm y S = 6.15 cm

Estimación puntual• La primera suposición que se hizo fue sobre el

tipo de ley de distribución de la variable aleatoria talla en la población (NORMAL).

• Sin hacer esa suposición no hubiese sido posible resolver el problema de estimación.

• Después se hizo la selección de la muestra y se sustituyeron los valores en las fórmulas.

• La utilidad práctica del estadígrafo radica en que por medio de un proceder de cálculo se obtiene un valor único, la estimación puntual.

Estimación puntual• La media muestral es un estimador de la media

poblacional ,

• La desviación estándar muestral S, sirve de estimador de la desviación estándar poblacional .

X

Estimación puntual• De igual forma, en el estudio de proporciones, la

proporción muestral p sirve de estimador de la proporción poblacional P.

ap= P

n

Estimación puntual• Constituye, en este esquema, un aspecto esencial

la selección de la muestra, con la que, por sustitución de los valores observados en la expresión del estimador, hallamos un valor numérico (una estimación) que debe corresponder a un parámetro poblacional bajo estudio, descriptor de una propiedad de interés. Luego, por el momento lo que tenemos son

estimaciones puntuales tanto de medias como

de proporciones poblacionales.

Estimación puntual• La incertidumbre en el proceso de selección de

muestras aleatorias, deja en dudas la utilidad de la estimación puntual.

• No se tiene información en relación con cuán cerca está el valor encontrado del verdadero valor del parámetro poblacional.

• No conocemos si la diferencia entre la cifra estimada y el verdadero valor del parámetro es admisible o no.

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Estimación por intervalo de confianza

• Una solución mejor, que incluye el error debido al muestreo.

• Se conoce como intervalo de confianza para estimar un parámetro desconocido al intervalo aleatorio de la forma donde:

Límite inferior

Límite inferior • Que esperamos que

contenga al parámetro con una Probabilidad dada.

95%, 99%

PARA RECORDAR

Distribución de la media muestral con varianza conocida

• Si una variable aleatoria X sigue una distribución normal con media y conocida

• Entonces la media muestral de tamaño n, sigue una distribución también normal con media y desviación estándar igual a dividida por la raíz del tamaño de muestra n.

• Por consiguiente, la variable aleatoria Z obtenida mediante el procedimiento ya estudiado anteriormente sigue la normal estándar.

Distribución de la media muestral con varianza conocida

• Si X N ( , ) , entonces

• Por consiguiente, la variable aleatoria Z obtenida mediante el procedimiento sigue la normal estándar.

)Xn

( )X

Z N 0 , 1

n

( )

XZ N 0 , 1

Coeficiente de confianza.

Distribución de la media muestral con varianza desconocida

• Si se presenta una situación similar pero con desconocida, entonces el estadígrafo definido es t y una distribución t-Student con n-1 grados de libertad.

• Recordemos también que esta distribución para más de 30 observaciones se aproxima a la normal estándar.

Distribución de la media muestral con varianza conocida

• Si X N ( , ) , con desconocida.

• Donde S es la desviación estándar de la muestra

( )X

n-1S

n

t t

Intervalo de confianzapara con conocida

• Se denomina intervalo de confianza para con nivel de confiabilidad del (1-) ·100%, a la expresión:

• z1−/2: percentil de orden 1−a/2 de la distribución normal estándar.

• Si 1- = 0,95 Z1−/2 = 1,96• Si 1- = 0,99 Z1−/2 = 2,58

1 12 2X Z , X Z

n n

Intervalo de confianzapara con conocida

• Se denomina intervalo de confianza para con nivel de confiabilidad del (1-) ·100%, a la expresión:

• z1−/2: percentil de orden 1−a/2 de la distribución normal estándar.

• Si 1- = 0,95 Z1−/2 = 1,96• Si 1- = 0,99 Z1−/2 = 2,58

1 12 2X Z , X Z

n n

Intervalo de Confianza

1 2X Z

n

1 2X Z

n

Ejemplo• Un cardiólogo desea hallar un intervalo de

confianza del 95% para el nivel de colesterol promedio de todos los pacientes que presentan problemas cardíacos, asume que la distribución de los niveles de colesterol es normal con una desviación estándar =0,47 y utiliza la siguiente muestra al azar de niveles de colesterol en mmol/L de 20 pacientes con problemas cardíacos.

4,7 4,8 4,6 4,9 4,55,0 4,4 5,1 4,3 5,24,2 5,2 4,2 5,2 4,25,3 4,3 6,0 4,7 4,8

• Primer paso:

– Estimar el valor de

• Segundo paso:

– Determinar el Coeficiente de Confianza “Z”

• Tercer paso:

– Determinar el Intervalo de Confianza

• Cuarto paso:

– Interpretar el Resultado

11 2 n+ +...+

X= = 4.78n

x x x

295% 1-Z1−a/2 = 1,96

0.975

0,474.78 1.96 4.78 0.21

20X Z

n

3

4.78 – 0.21 , 4.78 + 0.21

4.57 , 4.99

4Con un nivel de confiabilidad del 95 % podemos afirmar que el nivel de colesterol de todos los pacientes con problemas cardíacos se encuentra entre 4.57 y 4.99 mmol / litro

Intervalo de Confianza

4.57 mmol / litro 4.99 mmol / litro

Nivel de confiabilidad del 95 %

Intervalo de confianzapara con desconocida

• Para n>30

• z1−/2: percentil de orden 1−a/2

de la distribución normal estándar.

• Si 1- = 0,95 Z1−/2 = 1,96

• Si 1- = 0,99 Z1−/2 = 2,58

1 12 2

S SX Z , X Zn n

Intervalo de confianzapara con desconocida

• Para n<30

• t n-1 , 1−/2: percentil de orden 1−a/2

de la t-Student con n-1 grados de libertad

1 12 2n-1, n-1 ,

S SX t , X tn n

Ejemplo• La distribución del total de las calificaciones en

siete pruebas efectuadas se comportan normalmente.

• Se extrae una muestra de 40 estudiantes que realizaron las pruebas y se obtienen los siguientes datos:

658 562 731 710 679 631 694 663 615 623654 565 669 710 654 720 729 700 617 683657 721 635 617 795 580 689 638 689 710642 704 641 721 767 625 741 694 689 702

n >30

• Primer paso:

– Estimar el valor de y

• Segundo paso:

– Determinar el Coeficiente de Confianza “Z”

• Tercer paso:

– Determinar el Intervalo de Confianza

• Cuarto paso:

– Interpretar el Resultado

11 2 n+ +...+

X= = 673.10n

x x x

295% 1-Z1−a/2 = 1,96

2 2 2

+ +...+1 2 nS= =51,86

n-1

-X -X -XX X X

0.95

51.86SX ± Z × = 673.10 ± 1.96 × = 673.10 ± 16.59n 40

3

673.10 – 16.59 , 673.10 + 16.59

656.51 , 689.69

Con un nivel de confiabilidad del 95 % podemos afirmar que el total promedio en las pruebas de ingreso de todos los estudiantes se encuentra entre 656.51 y 689.69.

4

Intervalo de Confianza

656.51 689.69

Nivel de confiabilidad del 95 %

Estimación por intervalos de confianza de una proporción poblacional ( P )

• Al igual que sucede con la media muestral, para muestras grandes este sigue una distribución NORMAL con media P y varianza P.Q dividido por el tamaño de la muestra.

• Donde Q = 1 – P

)P Qp ~ N ( P , n

• Primer paso:

– Estimar el valor de P

• Segundo paso:

– Determinar el Coeficiente de Confianza “Z”95% Z1−/2 = 1,9699% Z1−a/2 = 2,58

• Tercer paso:

– Determinar el Intervalo de Confianza

• Cuarto paso:

– Interpretar el Resultado

ap

n

α1- 2

qp ± Z . p . "q= 1-p"n

Ejemplo

• Se quiere hallar un intervalo de confianza con el

95 % de confiabilidad para la proporción en la

población, de enfermos de estomatitis subprótesis.

Se realiza un pesquizaje en portadores de prótesis

estomatológicas de Ciudad de La Habana,

efectuándose para ello, la selección de una

muestra aleatoria de 50 portadores, y se encuentra

que 25 padecían de la citada enfermedad.

1

295% Z1−a/2 = 1,96

a 25p = = = 0.5

n 50

3

Con un nivel de confiabilidad del 95 % podemos afirmar que la verdadera proporción de enfermos de estomatitis subprótesis en la población se encuentra entre 0.36 y 0.64 :

4

α1- 2

qp ± Z . p . "q= 1-p"n

0.50.5 ± 1.96 . 0.5 . = 0.5 ± 0.1450

IC: 0.36 , 0.64

TAMAÑO DE LA MUESTRA

Precisión:

Tamaño de la muestra:

¿De qué factores depende el ¿De qué factores depende el tamaño de la muestra?tamaño de la muestra?

1 2.d = Z

n

2α1- 2

Sn = (Z . )d

1. Variabilidad del universo que se estudia.

2. Precisión que se quiere de los resultados.

FACTORES PARA DETERMINAR EL TAMAÑO DE LA MUESTRA

3. Confiabilidad que se desea obtener.

Supongamos que se quiere hacer una estimación por intervalo de confianza para la media de la población de tallas de niñas de 7 años. Se selecciona una muestra aleatoria de niñas para estimar la media poblacional y se desea alcanzar una precisión de 1 cm. Si se conoce que la desviación estándar de la talla en la población es 5.53cm, con una confiabilidad del 95 %. ¿Cuál sería un tamaño de muestra adecuado?

EJEMPLO

TAMAÑO DE LA MUESTRA

n = (z1−a/2 s / d)2

Fórmula del tamaño de la muestra:

n = (1,96 . 5,53 / 1)2

n = 118

Estimador y EstimaciónEstimador y Estimación

Llamamos estimador a una función de los elementos de una muestra aleatoriamientras que llamamos estimación a la cifra numérica o valor observado del estimador, obtenida por sustitución de los valores muestrales en la expresión del estimador.

Intervalos de ConfianzaIntervalos de Confianza

Los intervalos de confianza se construyen como función de los valores observados en la muestra y nos permiten afirmar que el parámetro desconocido se encuentra entre ciertos valores con un determinado nivel de confiablidad.