1
PROBABILIDAD Y ESTADÍSTICA .UTN. VENADO TUERTO.
Est. Norma Baccola,Prof. Rosana Gasperi,Est. Ma. Gabriela Curti
Bibliografía de Referencia: Montgomery Douglas-Runger George-Mac Graw Hill.-
Capítulo 7-
ESTIMACIÓN POR INTERVALOS En muchas situaciones una estimación puntual no proporciona información suficiente
sobre un parámetro. Por ejemplo si se tiene interés en estimar la resistencia promedio a
la tensión de los elementos estructurales empleados en el ala de un aeroplano, entonces
es probable que un solo número no sea tan significativo como un intervalo, dentro del
cual se espera encontrar el valor de éste parámetro. El intervalo estimado recibe el
nombre de intervalo de confianza.
El método de estimación por intervalos extiende e l concepto de la estimación
puntual a la generación de un intervalo que contendrá el auténtico valor del
parámetro con un determinado nivel de confianza.
A continuación veremos la forma de:
Comprender el método general para derivar intervalos de confianza
Construir intervalos de confianza para la media poblacional
Construir intervalos de confianza para la varianza de una población normal
Construir intervalos de confianza para una proporción p
Un parámetro poblacional puede ser estimado puntualmente a partir de los datos de una
muestra.
• Por ejemplo si ̂ = =1000 representa una estimación para la
viscosidad de un producto químico; es casi imposible que μ=
• Cuan cerca está ̂ de μ ?
• Es posible que o que ? Estimación por intervalos: límites que representan un intervalo de posibles valores
para el parámetro desconocido
Una estimación por intervalo para un parámetro poblacional se conoce como un
Intervalo de confianza
No tenemos certeza de que el intervalo contenga al valor verdadero y desconocido del
parámetro poblacional
A partir de una muestra construimos el estimador puntual y el intervalo
El intervalo es construido de tal forma que se tiene una confianza alta de contener al
parámetro
Desarrollo de un Intervalo de Confianza y sus Propiedades Básicas:
Una estimación por intervalo de un parámetro desconocido es un intervalo de la
forma l≤ ≤u, donde los puntos l y u dependen:
1. del valor numérico de la estadística ̂ para una muestra en particular,
2. y de la distribución de muestreo de ̂ .
Puesto que muestras diferentes producen valores distintos de ̂ y, en consecuencia,
valores diferentes de los puntos extremos l y u, estos puntos son valores de variables
aleatorias.
De la distribución de ̂ es posible determinar los valores de l y u tales que la
siguiente proposición de probabilidad es verdadera:
x
x
1100900 1010990
2
P(l≤≤u) = 1 donde 0<<1. Por tanto, se tiene una probabilidad de 1 de
seleccionar una muestra que produzca un intervalo que contiene el valor verdadero de
El intervalo resultante
l ≤ ≤ u
Se conoce como intervalo de confianza del 100(1 por ciento para el parámetro
desconocido Las cantidades l y u reciben el nombre de limite de confianza inferior y superior,
respectivamente ,
y 1 es el coeficiente de confianza.
Este intervalo recibe el nombre más apropiado de intervalo de confianza bilateral, ya
que especifica los límites inferior y superior de
En ocasiones puede resultar más apropiado un intervalo de confianza unilateral.
La interpretación de un intervalo de confianza es que, si se recopila un número
infinito de muestras aleatorias y se calcula un intervalo de confianza del 100(1 por
ciento para , para cada una de las muestras, entonces el 100(1 por ciento de esos
intervalos contiene el valor verdadero de
Esta situación se ilustra en la siguiente imagen,
la cual presenta varios intervalos de confianza del 100(1 por ciento para la media μ
de una distribución. Los puntos del centro de cada intervalo indican la estimación
puntual de μ (en este caso ). Nótese que solo uno de los 16 intervalos no contiene el
valor verdadero de μ .
Si el intervalo de confianza fuera del 95% esto significaría que en una corrida
larga sólo el 5% de los intervalos no contendría a μ.-
Ahora, en la práctica se obtiene sólo una muestra aleatoria y se calcula un intervalo de
confianza.
Puesto que éste intervalo puede o nó contener el valor verdadero del parámetro
La proposición adecuada es que el intervalo observado [l , u] contiene el valor
verdadero de con una confianza 100(1
Esta proposición tiene una interpretación de frecuencia; esto es, no se sabe si es
correcta para la muestra en particular, pero el método utilizado para obtener el intervalo
[l , u] proporciona proposiciones correctas el 100(1 por ciento de las veces.
x
3
La longitud “u-l” del intervalo de confianza observado es una medida importante de
la calidad de la información obtenida de la muestra.
El semintervalo l o u-se conoce como precisión del estimador.
Entre más grande sea el intervalo de confianza, mayor es la seguridad de que el
intervalo contenga el valor verdadero del parámetro
Por otra parte, entre más grande sea el intervalo, menor información se tiene acerca
del valor verdadero de
Puesto que la longitud del intervalo de confianza mide la precisión de una estimación,
se observa entonces que la precisión está inversamente relacionada con el nivel de
confianza.-
Es una situación “ideal” si se tiene un intervalo relativamente pequeño con una
confianza grande.
Veremos métodos para encontrar intervalos de confianza para medias, varianzas y
proporciones. Las aplicaciones de estos tipos de intervalos de confianza se encuentran
con frecuencia en la ingeniería, en la ciencia y en la administración
Intervalo de Confianza para la Media de una Distribución Normal, Varianza
Conocida Supongamos que se tiene una población con media desconocida μ
y varianza conocida 2 . De esta población se toma una muestra aleatoria de tamaño n.
La media muestral x es un estimador puntual razonable de la media desconocida μ .
Puede obtenerse un intervalo de confianza del 100(1-) por ciento para μ al considerar
la distribución de muestreo de la media muestral x .
Dicha distribución (como ya vimos anteriormente) es normal si la población es normal;
y es aproximadamente normal si se satisfacen las condiciones del TCL (teorema central
del límite).
El valor esperado o media de x es μ , mientras que el de la varianza es 2/n .
Por consiguiente la distribución de la estadística z (vista anteriormente) sigue una
distribución normal estándar:
z = n
x
/
la distribución de z aparece el la siguiente figura
Al examinar esta figura a de la diapositiva anterior se observa que:
P (-z/2 < Z < z/2 ) = 1-
4
• Donde los límites l= -z/2 y u=z/2 son los límites de confianza inferior y
superior, respectivamente.
• Como Z tiene una distribución normal estándar, entonces:
Definición :
Si x es la media muestral de una muestra aleatoria de tamaño n de una población con
varianza conocida σ2 , un intervalo para μ del 100(1 por ciento está dado por la
siguiente figura (8-7).
Donde z/2 es el punto de la distribución normal que corresponde al porcentaje /2.
Para muestras tomadas de una población normal, o para muestras de tamaño n ≥ 30 sin
importar la forma que tenga la población, el intervalo de confianza dado por la ecuación
8-7 proporciona buenos resultados. Sin embargo, para muestras pequeñas tomadas de
poblaciones que no son normales, no es posible esperar que el nivel de confianza 1-α
sea exacto.-
Intervalo de Confianza para la Media de una Distribución Normal,
Varianza Conocida Nivel de Confianza y Precisión de la estimación La longitud de un intervalo de confianza es una medida de la precisión de la
estimación.
Figura 2: error al estimar con x
5
Intervalo de Confianza para la Media de una
Distribución Normal, Varianza Conocida
Nivel de Confianza y Precisión de la estimación
• La longitud disminuye si:
• Se reduce el nivel de confianza (α más grande)
•Se aumenta el tamaño de la muestra.
Figura 3: longitud del intervalo de confianza
longitud=2zα/2σ/ n
Ejemplo I ( 7.1.-) Considérese los datos de conductividad térmica para el hierro Armco del ejemplo de
estimación puntual visto anteriormente. Supóngase que se desea encontrar un intervalo
de confianza del 95% para conductividad térmica promedio de este material, y se sabe
que la desviación estándar de la conductividad térmica a 100°F y 550W es
σ = 0.30 Btu/hr-ft-°F. Si se supone que la conductividad térmica está distribuida de
manera normal (o que se satisfacen las condiciones del teorema del límite central),
entonces puede emplearse la ecuación 8-7 para construir el intervalo de confianza.
Un intervalo del 95% implica que 1- α = 0.95, de modo que α = 0.05.
De la tabla II del apéndice, z α/2= z 0.05/2= z 0.025= 1.96
El límite inferior de confianza es l = x - z α/2 /√n
= 41.924 – 1.96 (0.30)/√10
= 41.924 – 0.186
= 41.738
Y el límite superior de confianza es u = x +z α/2 /√n
= 41.924 + 1.96(0.30)/√10
= 41.924 + 0.186
= 42.110
Por lo tanto, el intervalo de confianza bilateral del 95% es
41.738≤ μ ≤42.110
Este es nuestro intervalo de valores razonables para la conductividad térmica
promedio con una confianza del 95%.-
Nivel de confianza y precisión de la estimación: Nótese que en el ejemplo anterior, la selección de un nivel de confianza del 95% es
esencialmente arbitraria.
6
Nos preguntamos ahora ¿Qué habría pasado si se hubiera escogido un nivel de
confianza mayor, por ejemplo, 99%? De hecho ¿no parece razonable que se desee un
nivel de confianza mayor?
Un intervalo del 99% implica que 1- α = 0.99, de modo que α = 0.01
De la tabla II del apéndice, z α/2= z 0.01/2= z 0.005= 2.58 (vimos anteriormente que para α =
0.05, z 0.025= 1.96)
Por lo tanto , la longitud del intervalo de confianza del 95% es:
2 (1.96 /√n) = 3.92 /√n
Mientras que la longitud del intervalo de confianza del 99% es:
2 (2.58 /√n) = 5.16 /√n
El intervalo de confianza del 99% es mayor que la del intervalo del 95%. Ésta es la
razón por la que se tiene un nivel de confianza mayor con el intervalo del 99%. En
general, para un tamaño de muestra fijo n y desviación estándar entre más grande
sea el nivel de confianza, más grande es el intervalo de confianza resultante
Puesto que la longitud del intervalo de confianza mide la precisión de una estimación,
se observa entonces que la precisión está inversamente relacionada con el nivel de
confianza.
Relación general entre el tamaño de la muestra , la longitud deseada del intervalo
de confianza , el nivel de confianza 100(1-α) por ciento y la desviación estándar σ:
Conforme disminuye la longitud del intervalo, el tamaño n aumenta para valores
fijos de σ y para la confianza especificada.-
A medida que σ aumenta el tamaño requerido de la muestra n aumenta para una
longitud deseada y una confianza especificada
Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n
aumenta para la longitud fija deseada y una desviación estándar de σ
El procedimiento visto anteriormente para construir intervalos de confianza para µ es
válido si:
• σ es conocida y la población es normal
• σ es conocida y n es grande ( n>30) sin importar la distribución subyacente ya
que aplica el TCL
• Si σ es desconocida y n es razonablemente grande
Intervalos para Variancia Desconocida con Distribución t • Si σ es desconocida y el tamaño de la muestra es pequeño, entonces hay que
suponer una distribución para la población
• Pequeñas desviaciones del modelo normal no restan validez al procedimiento
• Si esta suposición no es razonable hay que utilizar otras técnicas.
La distribución t Definición: Sea X1 X2....Xn una muestra aleatoria tomada de una distribución normal
con media μ y varianza σ2 desconocida. La distribución de muestreo de la estadística T
que figura abajo
7
Es la distribución t con n-1 grados de libertad
Vemos como resulta el intervalo de confianza para μ siguiendo el mismo procedimiento
visto hasta ahora :
Ejemplos II (7.4): Un artículo en el Journal of testing and Evaluation (Vol. 10, N° 4, 1982, pag 133)
presenta las siguientes 20 mediciones del tiempo de combustión residual (en segundos)
de especímenes tratados de ropa de dormir para niños.
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un intervalo de confianza del 95 % para el tiempo de combustión
residual promedio.
Supóngase que el tiempo de combustión residual sigue una distribución normal :
= 9.8525
S = 0.0965
De la tabla IV del apéndice se tiene t0.025,19 = 2.093.Los límites de confianza del 95%
inferior y superior son
El límite inferior de confianza es l = - t α/2, n-1 S/√n
= 9.8525 – 2.093 (0.0965)/√20
= 9.8073 seg
x
x
8
Y el límite superior de confianza es u = + t α/2, n-1 S/√n
= 9.8525 + 2.093 (0.0965)/√20
= 9.8977 seg
Por lo tanto, el intervalo de confianza bilateral del 95% es
9.8073 seg ≤ μ ≤9.8977 seg
Éste es el intervalo de valores razonables para el tiempo de combustión residual
promedio con una confianza del 95%.-
De la misma forma analizada hasta ésta momento, es posible encontrar intervalos
para otros parámetros y para diferencias de parámetros. El resumen de estos
procedimientos se ven en el cuadro de la fotocopia de la página 362 del libro
“Probabilidad y Estadística aplicadas a la ingeniería de Douglas Montgomery y
George C. Runger”.-
Ejemplos V ( 7.7): Intervalo para variancia:
Un fabricante de detergente líquido está interesado en la uniformidad de la máquina
utilizada para llenar las botellas. De manera específica, es deseable que la desviación
estándar σ del proceso de llenado sea menor que 0.15 onzas de líquido; de otro modo ,
existe un porcentaje mayor del deseable de botellas con un contenido menor de
detergente. Supóngase que la distribución del volumen del llenado es aproximadamente
normal. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral
S2 = 0.0153( onzas de fluido)
2
El intervalo superior de confianza del 95% se obtiene a partir de la siguiente
ecuación:
σ2≤ (n-1) S
2 / χ
21-α, n-1
σ2≤ (n-1) S
2 / χ
20.95, 19
reemplazando valores y utilizando tabla III de Chi cuadrada
σ2≤ (19) 0.0153 / 10.117 = 0.0287 onzas de líquido
La proposición anterior puede convertirse en un intervalo de confianza sobre la
desviación estándar σ al obtener la raíz cuadrada de ambos miembros, lo que da como
resultado
σ ≤ 0.17
Por consiguiente ,con un nivel de confianza del 95% los datos no apoyan la afirmación
de que la desviación estándar del proceso es menor que 0.15 onzas de líquido-
Ejemplos VI (7.9): Intervalo para proporciones:
x
9
En una muestra aleatoria de 85 soportes para cigüeñal de un motor de automóvil, 10
tiene un terminado que es más rugoso de lo que las especificaciones permiten. Por
consiguiente, una estimación puntual de la proporción de soportes en la población que
exceden las especificaciones de rugosidad es p̂ = x/n = 10/85 = 0.12. Puede calcularse
un intervalo de confianza bilateral del 95% para p a partir de la ecuación 8-25
Reemplazando los términos:
0.12 – 1.96 /√0.12(0.88)/85 ≤ p ≤ 0.12 + 1.96 /√0.12(0.88)/85
Cuya simplificación es:
0.05 ≤ p ≤ 019
Práctica de Intervalos de Confianza:
Ejercicio 1 : Un fabricante produce anillos para los pistones de un motor de automóvil.
Se sabe que l diámetro del anillo está distribuido aproximadamente de manera normal, y
que tiene una desviación estándar σ= 0.001.Una muestra aleatoria tiene un diámetro
promedio de =74.036 mm
a) Construya un intervalo de confianza bilateral del 99% para el diámetro promedio
del anillo.-
Respuesta: 74.0353≤ μ ≤ 74.0367
Ejercicio 2 :Un ingeniero civil analiza la resistencia a la compresión del concreto. La
resistencia está distribuida aproximadamente normal, con varianza σ2 = 1000 (psi)
2 .
Al tomar una muestra aleatoria de 12 especímenes, se tiene que = 3250 psi.-
a) Construya un intervalo de confianza bilateral del 95% para la resistencia a la
compresión promedio.-
b) Construya un intervalo de confianza bilateral del 99% para la resistencia de la
compresión promedio.
c) Compare el ancho de este intervalo de confianza con el ancho encontrado en el
inciso a).-
Respuesta
a)3232.11≤ μ ≤ 3267.89
b)3226.49 ≤ μ ≤ 3273.51
Ejercicio 3: Una empresa fabrica un nuevo tipo de lámparas eléctricas y está interesada
en estimar la vida útil de las mismas. Se realizan ensayos obteniéndose los datos
siguientes:
x
x
10
765 780 790 775 769 748 785 768 767 788
792 793 785 784 782 788 765 790 798 768
775 770 771 759 783 790 783 781 795 791
782 786 790 785 779 768 783 784 790 784
782 789 780 779 782 789 792 795 785 783
787 782 784 786 783 790 783 785 781 786 a) Construir un intervalo de confianza al 95% para la vida media de las lámparas
producidas por la empresa.-
Ejercicio 4: Una papelera recibe un cargamento de un fabricante de cierta marca de bolígrafos de
bajo costo. Se prueba una muestra aleatoria de 300 bolígrafos y se encuentra que 30
están defectuosos.
a) Establezca un intervalo de confianza de 95% para estimar la proporción de
bolígrafos defectuosos en el cargamento.
b) El cargamento se puede devolver si contiene más de 5% de bolígrafos
defectuosos, según los resultados de la muestra, ¿Puede la papelera devolverlo?
c) Suponga que se desea un intervalo del 99% de confianza en (a)¿Cuál sería el
efecto de este cambio en sus respuestas de (a) y(b)?
Top Related