Download - EStimacion Por Intervalos

1

PROBABILIDAD Y ESTADÍSTICA .UTN. VENADO TUERTO.

Est. Norma Baccola,Prof. Rosana Gasperi,Est. Ma. Gabriela Curti

Bibliografía de Referencia: Montgomery Douglas-Runger George-Mac Graw Hill.-

Capítulo 7-

ESTIMACIÓN POR INTERVALOS En muchas situaciones una estimación puntual no proporciona información suficiente

sobre un parámetro. Por ejemplo si se tiene interés en estimar la resistencia promedio a

la tensión de los elementos estructurales empleados en el ala de un aeroplano, entonces

es probable que un solo número no sea tan significativo como un intervalo, dentro del

cual se espera encontrar el valor de éste parámetro. El intervalo estimado recibe el

nombre de intervalo de confianza.

El método de estimación por intervalos extiende e l concepto de la estimación

puntual a la generación de un intervalo que contendrá el auténtico valor del

parámetro con un determinado nivel de confianza.

A continuación veremos la forma de:

Comprender el método general para derivar intervalos de confianza

Construir intervalos de confianza para la media poblacional

Construir intervalos de confianza para la varianza de una población normal

Construir intervalos de confianza para una proporción p

Un parámetro poblacional puede ser estimado puntualmente a partir de los datos de una

muestra.

• Por ejemplo si ̂ = =1000 representa una estimación para la

viscosidad de un producto químico; es casi imposible que μ=

• Cuan cerca está ̂ de μ ?

• Es posible que o que ? Estimación por intervalos: límites que representan un intervalo de posibles valores

para el parámetro desconocido

Una estimación por intervalo para un parámetro poblacional se conoce como un

Intervalo de confianza

No tenemos certeza de que el intervalo contenga al valor verdadero y desconocido del

parámetro poblacional

A partir de una muestra construimos el estimador puntual y el intervalo

El intervalo es construido de tal forma que se tiene una confianza alta de contener al

parámetro

Desarrollo de un Intervalo de Confianza y sus Propiedades Básicas:

Una estimación por intervalo de un parámetro desconocido es un intervalo de la

forma l≤ ≤u, donde los puntos l y u dependen:

1. del valor numérico de la estadística ̂ para una muestra en particular,

2. y de la distribución de muestreo de ̂ .

Puesto que muestras diferentes producen valores distintos de ̂ y, en consecuencia,

valores diferentes de los puntos extremos l y u, estos puntos son valores de variables

aleatorias.

De la distribución de ̂ es posible determinar los valores de l y u tales que la

siguiente proposición de probabilidad es verdadera:

x

x

1100900 1010990

2

P(l≤≤u) = 1 donde 0<<1. Por tanto, se tiene una probabilidad de 1 de

seleccionar una muestra que produzca un intervalo que contiene el valor verdadero de

El intervalo resultante

l ≤ ≤ u

Se conoce como intervalo de confianza del 100(1 por ciento para el parámetro

desconocido Las cantidades l y u reciben el nombre de limite de confianza inferior y superior,

respectivamente ,

y 1 es el coeficiente de confianza.

Este intervalo recibe el nombre más apropiado de intervalo de confianza bilateral, ya

que especifica los límites inferior y superior de

En ocasiones puede resultar más apropiado un intervalo de confianza unilateral.

La interpretación de un intervalo de confianza es que, si se recopila un número

infinito de muestras aleatorias y se calcula un intervalo de confianza del 100(1 por

ciento para , para cada una de las muestras, entonces el 100(1 por ciento de esos

intervalos contiene el valor verdadero de

Esta situación se ilustra en la siguiente imagen,

la cual presenta varios intervalos de confianza del 100(1 por ciento para la media μ

de una distribución. Los puntos del centro de cada intervalo indican la estimación

puntual de μ (en este caso ). Nótese que solo uno de los 16 intervalos no contiene el

valor verdadero de μ .

Si el intervalo de confianza fuera del 95% esto significaría que en una corrida

larga sólo el 5% de los intervalos no contendría a μ.-

Ahora, en la práctica se obtiene sólo una muestra aleatoria y se calcula un intervalo de

confianza.

Puesto que éste intervalo puede o nó contener el valor verdadero del parámetro

La proposición adecuada es que el intervalo observado [l , u] contiene el valor

verdadero de con una confianza 100(1

Esta proposición tiene una interpretación de frecuencia; esto es, no se sabe si es

correcta para la muestra en particular, pero el método utilizado para obtener el intervalo

[l , u] proporciona proposiciones correctas el 100(1 por ciento de las veces.

x

3

La longitud “u-l” del intervalo de confianza observado es una medida importante de

la calidad de la información obtenida de la muestra.

El semintervalo l o u-se conoce como precisión del estimador.

Entre más grande sea el intervalo de confianza, mayor es la seguridad de que el

intervalo contenga el valor verdadero del parámetro

Por otra parte, entre más grande sea el intervalo, menor información se tiene acerca

del valor verdadero de

Puesto que la longitud del intervalo de confianza mide la precisión de una estimación,

se observa entonces que la precisión está inversamente relacionada con el nivel de

confianza.-

Es una situación “ideal” si se tiene un intervalo relativamente pequeño con una

confianza grande.

Veremos métodos para encontrar intervalos de confianza para medias, varianzas y

proporciones. Las aplicaciones de estos tipos de intervalos de confianza se encuentran

con frecuencia en la ingeniería, en la ciencia y en la administración

Intervalo de Confianza para la Media de una Distribución Normal, Varianza

Conocida Supongamos que se tiene una población con media desconocida μ

y varianza conocida 2 . De esta población se toma una muestra aleatoria de tamaño n.

La media muestral x es un estimador puntual razonable de la media desconocida μ .

Puede obtenerse un intervalo de confianza del 100(1-) por ciento para μ al considerar

la distribución de muestreo de la media muestral x .

Dicha distribución (como ya vimos anteriormente) es normal si la población es normal;

y es aproximadamente normal si se satisfacen las condiciones del TCL (teorema central

del límite).

El valor esperado o media de x es μ , mientras que el de la varianza es 2/n .

Por consiguiente la distribución de la estadística z (vista anteriormente) sigue una

distribución normal estándar:

z = n

x

/

la distribución de z aparece el la siguiente figura

Al examinar esta figura a de la diapositiva anterior se observa que:

P (-z/2 < Z < z/2 ) = 1-

4

• Donde los límites l= -z/2 y u=z/2 son los límites de confianza inferior y

superior, respectivamente.

• Como Z tiene una distribución normal estándar, entonces:

Definición :

Si x es la media muestral de una muestra aleatoria de tamaño n de una población con

varianza conocida σ2 , un intervalo para μ del 100(1 por ciento está dado por la

siguiente figura (8-7).

Donde z/2 es el punto de la distribución normal que corresponde al porcentaje /2.

Para muestras tomadas de una población normal, o para muestras de tamaño n ≥ 30 sin

importar la forma que tenga la población, el intervalo de confianza dado por la ecuación

8-7 proporciona buenos resultados. Sin embargo, para muestras pequeñas tomadas de

poblaciones que no son normales, no es posible esperar que el nivel de confianza 1-α

sea exacto.-

Intervalo de Confianza para la Media de una Distribución Normal,

Varianza Conocida Nivel de Confianza y Precisión de la estimación La longitud de un intervalo de confianza es una medida de la precisión de la

estimación.

Figura 2: error al estimar con x

5

Intervalo de Confianza para la Media de una

Distribución Normal, Varianza Conocida

Nivel de Confianza y Precisión de la estimación

• La longitud disminuye si:

• Se reduce el nivel de confianza (α más grande)

•Se aumenta el tamaño de la muestra.

Figura 3: longitud del intervalo de confianza

longitud=2zα/2σ/ n

Ejemplo I ( 7.1.-) Considérese los datos de conductividad térmica para el hierro Armco del ejemplo de

estimación puntual visto anteriormente. Supóngase que se desea encontrar un intervalo

de confianza del 95% para conductividad térmica promedio de este material, y se sabe

que la desviación estándar de la conductividad térmica a 100°F y 550W es

σ = 0.30 Btu/hr-ft-°F. Si se supone que la conductividad térmica está distribuida de

manera normal (o que se satisfacen las condiciones del teorema del límite central),

entonces puede emplearse la ecuación 8-7 para construir el intervalo de confianza.

Un intervalo del 95% implica que 1- α = 0.95, de modo que α = 0.05.

De la tabla II del apéndice, z α/2= z 0.05/2= z 0.025= 1.96

El límite inferior de confianza es l = x - z α/2 /√n

= 41.924 – 1.96 (0.30)/√10

= 41.924 – 0.186

= 41.738

Y el límite superior de confianza es u = x +z α/2 /√n

= 41.924 + 1.96(0.30)/√10

= 41.924 + 0.186

= 42.110

Por lo tanto, el intervalo de confianza bilateral del 95% es

41.738≤ μ ≤42.110

Este es nuestro intervalo de valores razonables para la conductividad térmica

promedio con una confianza del 95%.-

Nivel de confianza y precisión de la estimación: Nótese que en el ejemplo anterior, la selección de un nivel de confianza del 95% es

esencialmente arbitraria.

6

Nos preguntamos ahora ¿Qué habría pasado si se hubiera escogido un nivel de

confianza mayor, por ejemplo, 99%? De hecho ¿no parece razonable que se desee un

nivel de confianza mayor?

Un intervalo del 99% implica que 1- α = 0.99, de modo que α = 0.01

De la tabla II del apéndice, z α/2= z 0.01/2= z 0.005= 2.58 (vimos anteriormente que para α =

0.05, z 0.025= 1.96)

Por lo tanto , la longitud del intervalo de confianza del 95% es:

2 (1.96 /√n) = 3.92 /√n

Mientras que la longitud del intervalo de confianza del 99% es:

2 (2.58 /√n) = 5.16 /√n

El intervalo de confianza del 99% es mayor que la del intervalo del 95%. Ésta es la

razón por la que se tiene un nivel de confianza mayor con el intervalo del 99%. En

general, para un tamaño de muestra fijo n y desviación estándar entre más grande

sea el nivel de confianza, más grande es el intervalo de confianza resultante

Puesto que la longitud del intervalo de confianza mide la precisión de una estimación,

se observa entonces que la precisión está inversamente relacionada con el nivel de

confianza.

Relación general entre el tamaño de la muestra , la longitud deseada del intervalo

de confianza , el nivel de confianza 100(1-α) por ciento y la desviación estándar σ:

Conforme disminuye la longitud del intervalo, el tamaño n aumenta para valores

fijos de σ y para la confianza especificada.-

A medida que σ aumenta el tamaño requerido de la muestra n aumenta para una

longitud deseada y una confianza especificada

Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n

aumenta para la longitud fija deseada y una desviación estándar de σ

El procedimiento visto anteriormente para construir intervalos de confianza para µ es

válido si:

• σ es conocida y la población es normal

• σ es conocida y n es grande ( n>30) sin importar la distribución subyacente ya

que aplica el TCL

• Si σ es desconocida y n es razonablemente grande

Intervalos para Variancia Desconocida con Distribución t • Si σ es desconocida y el tamaño de la muestra es pequeño, entonces hay que

suponer una distribución para la población

• Pequeñas desviaciones del modelo normal no restan validez al procedimiento

• Si esta suposición no es razonable hay que utilizar otras técnicas.

La distribución t Definición: Sea X1 X2....Xn una muestra aleatoria tomada de una distribución normal

con media μ y varianza σ2 desconocida. La distribución de muestreo de la estadística T

que figura abajo

7

Es la distribución t con n-1 grados de libertad

Vemos como resulta el intervalo de confianza para μ siguiendo el mismo procedimiento

visto hasta ahora :

Ejemplos II (7.4): Un artículo en el Journal of testing and Evaluation (Vol. 10, N° 4, 1982, pag 133)

presenta las siguientes 20 mediciones del tiempo de combustión residual (en segundos)

de especímenes tratados de ropa de dormir para niños.

9.85 9.93 9.75 9.77 9.67

9.87 9.67 9.94 9.85 9.75

9.83 9.92 9.74 9.99 9.88

9.95 9.95 9.93 9.92 9.89

Se desea encontrar un intervalo de confianza del 95 % para el tiempo de combustión

residual promedio.

Supóngase que el tiempo de combustión residual sigue una distribución normal :

= 9.8525

S = 0.0965

De la tabla IV del apéndice se tiene t0.025,19 = 2.093.Los límites de confianza del 95%

inferior y superior son

El límite inferior de confianza es l = - t α/2, n-1 S/√n

= 9.8525 – 2.093 (0.0965)/√20

= 9.8073 seg

x

x

8

Y el límite superior de confianza es u = + t α/2, n-1 S/√n

= 9.8525 + 2.093 (0.0965)/√20

= 9.8977 seg

Por lo tanto, el intervalo de confianza bilateral del 95% es

9.8073 seg ≤ μ ≤9.8977 seg

Éste es el intervalo de valores razonables para el tiempo de combustión residual

promedio con una confianza del 95%.-

De la misma forma analizada hasta ésta momento, es posible encontrar intervalos

para otros parámetros y para diferencias de parámetros. El resumen de estos

procedimientos se ven en el cuadro de la fotocopia de la página 362 del libro

“Probabilidad y Estadística aplicadas a la ingeniería de Douglas Montgomery y

George C. Runger”.-

Ejemplos V ( 7.7): Intervalo para variancia:

Un fabricante de detergente líquido está interesado en la uniformidad de la máquina

utilizada para llenar las botellas. De manera específica, es deseable que la desviación

estándar σ del proceso de llenado sea menor que 0.15 onzas de líquido; de otro modo ,

existe un porcentaje mayor del deseable de botellas con un contenido menor de

detergente. Supóngase que la distribución del volumen del llenado es aproximadamente

normal. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral

S2 = 0.0153( onzas de fluido)

2

El intervalo superior de confianza del 95% se obtiene a partir de la siguiente

ecuación:

σ2≤ (n-1) S

2 / χ

21-α, n-1

σ2≤ (n-1) S

2 / χ

20.95, 19

reemplazando valores y utilizando tabla III de Chi cuadrada

σ2≤ (19) 0.0153 / 10.117 = 0.0287 onzas de líquido

La proposición anterior puede convertirse en un intervalo de confianza sobre la

desviación estándar σ al obtener la raíz cuadrada de ambos miembros, lo que da como

resultado

σ ≤ 0.17

Por consiguiente ,con un nivel de confianza del 95% los datos no apoyan la afirmación

de que la desviación estándar del proceso es menor que 0.15 onzas de líquido-

Ejemplos VI (7.9): Intervalo para proporciones:

x

9

En una muestra aleatoria de 85 soportes para cigüeñal de un motor de automóvil, 10

tiene un terminado que es más rugoso de lo que las especificaciones permiten. Por

consiguiente, una estimación puntual de la proporción de soportes en la población que

exceden las especificaciones de rugosidad es p̂ = x/n = 10/85 = 0.12. Puede calcularse

un intervalo de confianza bilateral del 95% para p a partir de la ecuación 8-25

Reemplazando los términos:

0.12 – 1.96 /√0.12(0.88)/85 ≤ p ≤ 0.12 + 1.96 /√0.12(0.88)/85

Cuya simplificación es:

0.05 ≤ p ≤ 019

Práctica de Intervalos de Confianza:

Ejercicio 1 : Un fabricante produce anillos para los pistones de un motor de automóvil.

Se sabe que l diámetro del anillo está distribuido aproximadamente de manera normal, y

que tiene una desviación estándar σ= 0.001.Una muestra aleatoria tiene un diámetro

promedio de =74.036 mm

a) Construya un intervalo de confianza bilateral del 99% para el diámetro promedio

del anillo.-

Respuesta: 74.0353≤ μ ≤ 74.0367

Ejercicio 2 :Un ingeniero civil analiza la resistencia a la compresión del concreto. La

resistencia está distribuida aproximadamente normal, con varianza σ2 = 1000 (psi)

2 .

Al tomar una muestra aleatoria de 12 especímenes, se tiene que = 3250 psi.-

a) Construya un intervalo de confianza bilateral del 95% para la resistencia a la

compresión promedio.-

b) Construya un intervalo de confianza bilateral del 99% para la resistencia de la

compresión promedio.

c) Compare el ancho de este intervalo de confianza con el ancho encontrado en el

inciso a).-

Respuesta

a)3232.11≤ μ ≤ 3267.89

b)3226.49 ≤ μ ≤ 3273.51

Ejercicio 3: Una empresa fabrica un nuevo tipo de lámparas eléctricas y está interesada

en estimar la vida útil de las mismas. Se realizan ensayos obteniéndose los datos

siguientes:

x

x

10

765 780 790 775 769 748 785 768 767 788

792 793 785 784 782 788 765 790 798 768

775 770 771 759 783 790 783 781 795 791

782 786 790 785 779 768 783 784 790 784

782 789 780 779 782 789 792 795 785 783

787 782 784 786 783 790 783 785 781 786 a) Construir un intervalo de confianza al 95% para la vida media de las lámparas

producidas por la empresa.-

Ejercicio 4: Una papelera recibe un cargamento de un fabricante de cierta marca de bolígrafos de

bajo costo. Se prueba una muestra aleatoria de 300 bolígrafos y se encuentra que 30

están defectuosos.

a) Establezca un intervalo de confianza de 95% para estimar la proporción de

bolígrafos defectuosos en el cargamento.

b) El cargamento se puede devolver si contiene más de 5% de bolígrafos

defectuosos, según los resultados de la muestra, ¿Puede la papelera devolverlo?

c) Suponga que se desea un intervalo del 99% de confianza en (a)¿Cuál sería el

efecto de este cambio en sus respuestas de (a) y(b)?