Post on 11-Jun-2015
DR. JORGE ACUÑA A.
1
INGENIERIA INDUSTRIALINGENIERIA INDUSTRIAL
CONTROL DE CALIDAD ICONTROL DE CALIDAD I
2. ESTADISTICA2. ESTADISTICA
Muestras correctamente
seleccionadas permiten inferir
sobre la situación real de una
característica en estudio.
Aplicación de la estadística al
control de procesos y de materiales
es solamente un arma para la
toma de decisiones y no la solución
a los problemas existentes.
ING. JORGE ACUÑA A., PhD., PROFESOR
2
Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.
Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).
El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas químicas y servicioscon el fin de verificar su estado.
ING. JORGE ACUÑA A., PhD., PROFESOR
3
Datos deben ser veraces y reflejar las condiciones del proceso, datos erróneos generan conclusiones erróneas.
El analista debe tener plena confianza en los datos para que el estudio sea válido.
Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.
Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.
ING. JORGE ACUÑA A., PhD., PROFESOR
4
Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.
Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.
ING. JORGE ACUÑA A., PhD., PROFESOR
5
Visualizar la posible distribución de datos
Cada dato pierde su identidad.
Distribuciones estadísticas teóricas o
empíricas para inferir hacia el problema.
Distribuciones de frecuencia de datos no
agrupados presentan una distribución
que es muy difícil de aproximar.
Cifras significativas de los datos
Selección de un número de clases que
refleje una adecuada distribución. ING. JORGE ACUÑA A., PhD., PROFESOR
6
Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.
Ordenar los datos de menor a mayor.
Calcular el rango:
R = ximáx - ximín
Fijar el número de clases (k),
Calcular el intervalo de clase (i), así:
i = R/k
El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.
ING. JORGE ACUÑA A., PhD., PROFESOR
7
Calcular el rango propuesto (Rp)
Rp = ir * k
Calcular la diferencia (d)
d = Rp – R
Este valor es un número cuya última cifra significativa debe ser impar. Si no lo es, se debe devolver al paso 5 y hacer el cálculo con otro número de clases, hasta que se cumpla la condición.
Calcular la mitad de la diferencia (md)
md = d/2
ING. JORGE ACUÑA A., PhD., PROFESOR
8
Fijar los límites reales de clase (Li, Ls), usando el siguiente procedimiento:
a. Tomar el valor del dato menor y restarle el valor de md; el valor obtenido es el primer Li.
Li1 = ximín – md
b. Sumar i al valor de Li1, para obtener el primer Ls.
Ls1 = Li1 + i
Lsk = ximáx + md
donde Lsk = último límite real superior.
ING. JORGE ACUÑA A., PhD., PROFESOR
9
Completar el cuadro de
frecuencias de datos agrupados.
Construir el histograma para
observar la distribución del
conjunto de datos.
ING. JORGE ACUÑA A., PhD., PROFESOR
10
Se toman doce grupos de cinco unidades de una máquina llenadora de latas de pasta de tomate y se pesan, originando los siguientes datos:
Construir una distribución de frecuencias de datos agrupados.
ING. JORGE ACUÑA A., PhD., PROFESOR
11
ING. JORGE ACUÑA A., PhD., PROFESOR
12
HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Artículo: Pasta de tomate Código: XY-987
Característica: Peso Especificación: 20,0 2,5 decigramos
Operación: Llenado Máquina: Llenadora n=60
Operario: M. Matamoros Inspector: M. Coto Turno: 1
Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
# 1 2 3 4 5 6 7 8 9 10 11 12
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5
2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0
3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5
4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5
5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-
R = ximáx - ximín
R = 25,0 – 18,5 = 6,5
k = 1 + 3,3 log n
k = 1 + 3,3 log 60
k 7
R 6,5
i = —— = ——— = 0,923 = 1,0
k 7
Rp = ir * k = 7 * 1,0 = 7,0
ING. JORGE ACUÑA A., PhD., PROFESOR
13
d
md = d/2 = ——= 0,25
2
Li1 = ximín - md = 18,5 - 0,25 = 18,25
Ls1 = Li1 + i = 18,25 + 1,0 = 19,25
Li2 = Ls1 = 19,25
Ls2 = Li2 + i = 19,25 + 1,0 = 20,25
ING. JORGE ACUÑA A., PhD., PROFESOR
14
ING. JORGE ACUÑA A., PhD., PROFESOR
15
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS
–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Artículo: Pasta de tomate Código: XY-987
Característica: Peso Especificación: 20,0 2,5 decigramos
Operación: Llenado Máquina: Llenadora n=60
Operario: M. Matamoros Inspector: M. Coto Turno: 1
Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Li Ls CONTEO nk xk Nk fk Fk
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
18,25 19,25 ||||| 5 18,75 5 8,33 8,33
19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33
20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33
21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00
22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33
23,25 24,25 ||||| 5 23,75 58 8,33 96,67
24,25 25,25 || 2 24,75 60 3,33 100
ING. JORGE ACUÑA A., PhD., PROFESOR
16
in
dn
Ax
K
k
k
*
*1
2
11
2 **
*n
dn
n
dn
is
K
k
k
K
k
k
CV=s/x
PROMEDIO
DESVIACION
ESTANDAR
COEFICIENTE DE VARIACION:
Calcular la media aritmética y la desviación
estándar
_ A= 21,75 para d = 0
x = 21,75 + (-12/60) * 1,0 = 21,55 decigramos
ING. JORGE ACUÑA A., PhD., PROFESOR
17
decigramoss 525,160
12
60
142*0,1
2
––––––––––––––––––––––––––––––––––––––––––––––
xk nk d nk*d nk*d2
–––––––––––––––––––––––––––––––––––––––––––––
18,75 5 –3 –15 45
19,75 9 –2 –18 36
20,75 9 –1 – 9 9
21,75 16 0 0 0
22,75 14 1 14 14
23,75 5 2 10 20
24,75 2 3 6 18
––––––––––––––––––––––––––––––––––––––––––––––––––
TOTAL nk*d= –12 nk*d2= 142
Esta distribución conocida por su forma de campana (campana de Gauss) es una de las más importantes en teoría estadística.
Esta distribución tiene propiedades importantes, tales como: › Está definida de - a + . › Es simétrica lo que implica que la probabilidad de
ocurrencia de un valor x menor que la media es igual a la de un valor x mayor que la media.
› El área bajo la curva es 1. › La moda, media y mediana son iguales. › Si se conoce la media ( ) y la varianza ( 2) se
determina la curva
ING. JORGE ACUÑA A., PhD., PROFESOR
18
La distribución muestral es normal aunque la poblacional no lo sea. Tiene promedio y desviación estándar igual a /√n
Puede estandarizarse usando el estadístico Z = (x - )/ .
Las funciones densidad y acumulada son para - x + :
ING. JORGE ACUÑA A., PhD., PROFESOR
19
2
2
1
2
1)(
x
exf
b
a
dxxfxF )()(
Una fábrica especifica que el peso de los tarros de frutas que produce debe obedecer a un peso medio de 2,00 kg con una desviación estándar de 0,05 kg. ¿Cuál es la probabilidad de que un determinado tarro pese entre 1,90 y 2,06 kg, sabiendo que esta variable se distribuye normalmente?
ING. JORGE ACUÑA A., PhD., PROFESOR
20
05.0
29.1
05.0
206.206.19.1 NNxPA
A = N(1,2) – N(–2,0) A = 0,8849 – 0,0228 A = 0,8621 La probabilidad de que un determinado
tarro pese entre 1,90 y 2,06 kg es 0,8621.
ING. JORGE ACUÑA A., PhD., PROFESOR
21
1.9 2.06
A
"Si se toman m-muestras aleatorias de tamaño n de una población cuya distribución puede o no ser normal y que tiene media µ y desviación estándar , la distribución de muestreo correspondiente a los promedios de las m muestras será aproximadamente normal, con media µ igual a µ y desviación muestral igual a / n."
ING. JORGE ACUÑA A., PhD., PROFESOR
22
x
x
Un proceso de llenado de bolsas de
cacao en polvo origina un peso
medio de 50,10 g y una desviación
estándar de 5,25 g. Si se toma una
muestra de 40 bolsas, ¿cuál es la
probabilidad de que su media se
encuentre entre 48,10 y 50,90 g?
ING. JORGE ACUÑA A., PhD., PROFESOR
23
A=P(48,10< <50,9)= N((50,90-50,10)/0,83)
- N((48,10-50,10)/0,83)
A = N(0,96) - N(-2,41)
A = 0,83147 - 0,00798 (Obtenidos de Tablas )
A = 0,8235
La probabilidad de que la media de peso de
una muestra de 40 bolsas se encuentre entre
48,10 y 50,90 gramos es 0,8235.
ING. JORGE ACUÑA A., PhD., PROFESOR
24
x
En una industria se fabrican productos
que deben tener un peso medio
comprendido entre 10,049 y 10,095
g. Se toma una muestra de 15
unidades, originándose un promedio
de 10,072 g y una desviación
estándar de 0,100 g. ¿Cuál es la
probabilidad de cumplir con el peso
fijado?
ING. JORGE ACUÑA A., PhD., PROFESOR
25
P(10,049 10,095)=T((10,095-10,072)/(0,100/ 14))
-T((10,049-10,072)/(0,100/ 14))
= T (0,861) - T (-0,861)
= 0,80 - 0,20
= 0,60
La probabilidad de cumplir con el peso medio fijado es 0,60.
Los valores de T(0,861) y T(-0,861) sirven para calcular las probabilidades usando la Tablas.
ING. JORGE ACUÑA A., PhD., PROFESOR
26
x
Una máquina llenadora ha
ejecutado su operación con una
varianza de 0,83 grms2. Si se toma
una muestra de 15 unidades,
¿cuál es la probabilidad de tener
una varianza:
a. Superior a 1,31 grms2?
b. Inferior a 0,56 grms2?
ING. JORGE ACUÑA A., PhD., PROFESOR
27
n * s2 15 (1,31)
a. 2 = –––––– = –––––––– = 23,7
2 0,83
n * s2 15 (0,56)
b. 2 = –––––– = ———— = 10,1 2 0,83 Los valores de la probabilidad se encuentran en
Tablas.
En conclusión, la probabilidad de obtener una varianza superior a 1,31 grms2 es 0,05 y la de obtener una varianza inferior a 0,56 grms2 es 0,25.
ING. JORGE ACUÑA A., PhD., PROFESOR
28
En un proceso de corte de varillas para un ensamble especial, existen dos máquinas cortadoras tecnológicamente parecidas aunque diferentes en antigüedad. Esta similitud hace pensar que las varianzas de corte generadas por ambas máquinas puedan ser comparadas.
Si se toma una muestra de 16 elementos de cada máquina, calcular la probabilidad de que la razón de varianzas sea:
a. Mayor a 1,97 b. Menor a 0,508
ING. JORGE ACUÑA A., PhD., PROFESOR
29
Utilizando Tablas: v1 = n1 - 1 = 16 - 1 = 15 v2 = n2 - 1 = 16 - 1 = 15 Fv1,v2, 1= F15,15, 1 =1,97 para 1=0,10 Fv1,v2, 2= F15,15, 2 =0,508 para 2=0,10
pues F15,15, 2 = 1 / F15,15, 1 Como respuesta al problema se tiene que
la probabilidad de que la razón de varianzas sea superior a 1,97 es 0,10 y de que sea inferior a 0,508 es también 0,10.
ING. JORGE ACUÑA A., PhD., PROFESOR
30
Una distribución de variable discreta si se ajusta a experimentos que cumplen con cinco propiedades:
Hay n pruebas Existe una probabilidad de éxito p y una de fracaso q=1-p Las pruebas son independientes Interesan x casos del total de casos Las funciones densidad y acumulada así como el valor
esperado ( ) y la varianza ( 2) son las siguientes: f(x) = n px * q n-x para x 0
x (n-x) n’ F(x) = f(x) = np 2= npq X=0
ING. JORGE ACUÑA A., PhD., PROFESOR
31
Un cliente establece que para aceptar un lote de producto que le envía el fabricante, éste debe cumplir con el contrato firmado. Este contrato establece que el lote se acepta si una muestra de 20 unidades extraída de él, contiene dos o menos defectuosos.
Si el fabricante envía un lote 10% defectuoso, ¿cuál es la probabilidad de que sea rechazado?
ING. JORGE ACUÑA A., PhD., PROFESOR
32
Primero que todo se debe analizar si se cumple con las cuatro condiciones fijadas para la distribución binomial.
1. n = 20 3. Hay independencia 2. p = 0,10 4. x 2 Por leyes de probabilidad se tiene que la
probabilidad de rechazo es igual al complemento de la probabilidad de aceptación.
Sea:
P(X > 2) = 1 – P (X 2) 2 P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0
ING. JORGE ACUÑA A., PhD., PROFESOR
33
P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0 P(X 2) = b(0,20,0,10) + b(1,20,0,10) + b(2,20,0,10) 20! 20! 20! P(X 2) = ––––– 0,100 * 0,9020 + ––––––– 0,101 * 0,9019 + –––––– 0,102*0,9018
20! * 0! 19! * 1! 18! * 2!
P(X 2) = 0,1216+0,27+0,2853 = 0,6769 Probabilidad de rechazo = P(X>2) = 1 - P(X 2) = 1-0,6769 = 0,3231 Si se utiliza la Tabla se tiene que: P(X 2) = B (2,20,0,10) = 0,6769 P(X>2) = 1 - P(X 2) = 1 - 0,6769 = 0,3231
Por lo tanto la respuesta es que si se envía un lote
10% defectuoso la probabilidad de que sea rechazado es 0,3231.
ING. JORGE ACUÑA A., PhD., PROFESOR
34
Una compañía farmacéutica afirma que existe una probabilidad de 0,005 de que un paciente que ingiere un nuevo medicamento, sufra una reacción secundaria. Si 2000 pacientes compran este medicamento, ¿cuál es la probabilidad de que:
a. ocho sufran efectos secundarios? b. mas de ocho sufran efectos
secundarios?
ING. JORGE ACUÑA A., PhD., PROFESOR
35
p = 0,005 n = 2000 x= 8 = 2000 * 0,005 = 10 a. Utilizando la fórmula se tiene: 108
p (8,10) = e-10 ——— = 0,1126 8! Utilizando la Tabla p (8,10)= P (8,10)– P (7,10) = 0,333 – 0,220 = 0,113 Por lo tanto, la probabilidad de que ocho de los 2000
pacientes sufran efectos secundarios al ingerir el medicamento es 0,113.
b. P(x>8) = 1 - P( x 8 ) = 1 – 0,333 = 0,667 Por lo tanto, la probabilidad de que mas de ocho de los 2000
pacientes sufran efectos secundarios al ingerir el medicamento es 0,667.
ING. JORGE ACUÑA A., PhD., PROFESOR
36
Para µ, se calculan así:
_
Lc = x Z /2 * ——— si es conocida
n
_ s
Lc = x t /2 * ——— si es desconocida
n-1
Para 2, se calculan así:
ns2 ns2
LIc = ——— LSc = ———
2 1- /2 2
/2
ING. JORGE ACUÑA A., PhD., PROFESOR
37
Se toman 30 varillas cortadas por una
máquina cortadora. Si se tiene una
longitud promedio de 5,35 cm, con una
desviación típica de 0,85 cm.
a. ¿Cuáles son los límites de confianza para µ, con 95% de confianza?
b. ¿Cuáles son los límites de confianza para 2, con 95% de confianza?
c. Si se conociera que 2 es igual a 1,58 cm2,
¿cuál es la respuesta a la pregunta a?
ING. JORGE ACUÑA A., PhD., PROFESOR
38
_ a. n = 30 x = 5,35 cm s = 0,85 cm (1- ) = 0,95
= 0,05 _ s _ s LIc = x – t /2 ——— LSc = x + t /2 ——— n-1 n-1 0,85 0,85 LIc = 5,35 – 2,045 ——— LSc = 5,35 + 2,045 ——— 29 29 = 5,02 cm = 5,67 cm t /2 = t 0,025 = 2,045 de Tablas Esto significa que se puede afirmar con 95% de confianza
que el proceso de corte de varillas tiene un promedio de corte comprendido entre 5,02 cm y 5,67 cm.
ING. JORGE ACUÑA A., PhD., PROFESOR
39
b. s2 = 0,852 = 0,7225 cm2
n s2 30 (0,7225) 21,675 LIc = ——— = —————– = ––———— = 0,474 cm2
20,975 45,7 45,7
n s2 30(0,7225) 21,675 LSc = ——— = ————— = ———— = 1,35 cm2
2 0,025 16 16
Los valores de chi-cuadrado provienen de Tablas. Esto significa que se puede afirmar con 95% de confianza
que el proceso de corte de varillas tiene una varianza de corte comprendida entre 0,474 cm2 y 1,35 cm2.
ING. JORGE ACUÑA A., PhD., PROFESOR
40
c. Si 2 = 1,58 cm2 entonces = 1,257 cm. _ 1,257 LIc = x – Z /2 ——— = 5,35 – 1,96 ———— = 4,9 cm n 30 _ 1,257 LSc= x + Z /2 ——— = 5,35 + 1,96 ———– = 5,8 cm n 30 Los valores de Z se obtuvieron de tablas Esto significa que se puede afirmar con 95% de confianza que el
proceso de corte de varillas tiene un promedio de corte comprendido entre 4,9 cm y 5,8 cm.
ING. JORGE ACUÑA A., PhD., PROFESOR
41
Comportamiento de un proceso con el fin de ejecutar acciones que prevengan problemas de calidad.
Procedimiento mediante el cual, sujeto a un error tipo I denotado por , se contrasta una hipótesis planteada con el fin de probar su veracidad o su falsedad.
Error tipo I ( ) es la probabilidad de rechazar la hipótesis nula siendo esta verdadera.
Error tipo II (ß) es la probabilidad de aceptar la hipótesis nula siendo esta falsa.
ING. JORGE ACUÑA A., PhD., PROFESOR
42
a. Plantear la hipótesis nula H0 y la hipótesis alternativa denotada por Ha.
b. Prueba debe ser unilateral o bilateral.
c. Fijar el nivel de significación ( ) o error tipo I, (1%, 5% ó 10%)
d. Definir el estadístico a usar de acuerdo con la distribución de probabilidad que le corresponde a la variable en estudio y según lo que se desee probar (una media, dos medias, una varianza, dos varianzas, una proporción o dos proporciones).
ING. JORGE ACUÑA A., PhD., PROFESOR
43
e. Definir las áreas donde se cumplirá cada una de las hipótesis.
f. Calcular el valor del estadístico seleccionado
g. Comparar el estadístico obtenido con el estadístico teórico. El resultado permitirá conocer la decisión de aceptación o rechazo
h. Obtener las conclusiones del experimento efectuado. Un valor importante de calcular aquí es el error tipo II.
ING. JORGE ACUÑA A., PhD., PROFESOR
44
ING. JORGE ACUÑA A., PhD.,
PROFESOR 45
EJEMPLO 2.14 pag. 76EJEMPLO 2.14 pag. 76
En un proceso de fabricación de
piezas de precisión se quiere que el
valor nominal del diámetro de una
pieza sea 20,0 mm. Se conoce que la
desviación estándar de esta
característica es 3,0 mm. Se toma una
muestra de 25 piezas obteniéndose un
promedio de diámetro de 19,2 mm.
¿Se ha cumplido con lo requerido?
Use =5%.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 46
SOLUCION Se seguirá el procedimiento planteado.
a. Planteo de la hipótesis
H0: µ = 20,0
Ha: µ 20,0
b. La hipótesis es bilateral puesto que no
se cumple con lo requerido si el promedio de la
muestra es mayor o menor que lo especificado.
c. El nivel de significación es dado, = 5%.
d. El estadístico por usar es el siguiente:
_
x – µ
Z = ––––––
/ n
ING. JORGE ACUÑA A., PhD.,
PROFESOR 47
SOLUCION e. Las áreas de cumplimiento de la hipótesis .
f. Cálculo del estadístico citado en d.
_
x – µ 19,2 – 20,0
Z = ——— = —————— = –1,33
/ n 3,0/ 25
g. El valor de Z calculado (–1,33) se encuentra en
el área de cumplimiento de la hipótesis nula.
h. En conclusión, se puede afirmar, con =5%, que
estadísticamente se cumple con el valor nominal
requerido.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 48
EJEMPLO 2.15 pag. 77EJEMPLO 2.15 pag. 77
Si en el Ejemplo anterior no se
conoce la desviación estándar pero
a partir de la muestra se calcula una
desviación típica de 2,1 mm ¿Qué
conclusiones se obtienen? Use
=5%.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 49
SOLUCIONSOLUCION Se seguirá el procedimiento planteado. a. Planteo de la hipótesis H0: µ = 20,0 Ha: µ 20,0 b. La hipótesis es bilateral puesto que no se
cumple con lo requerido si el promedio de la muestra
es mayor o menor que lo especificado. c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente: _
x – µ t = ————
s/ n-1
ING. JORGE ACUÑA A., PhD.,
PROFESOR 50
SOLUCIONSOLUCION
e. Las áreas de cumplimiento de la hipótesis.
f. Cálculo del estadístico citado en d. _ x – µ 19,2 – 20,0 t = –––––––––– = —————— = –1,87 s/ n-1 2,1/ 24 g. El valor de t calculado (–1,87) se encuentra
en el área de cumplimiento de la hipótesis nula. h. En conclusión, se puede afirmar, con
= 5%, que estadísticamente se cumple con el valor
nominal requerido.
ING. JORGE ACUÑA A., PhD., PROFESOR
51
Un proveedor envía lotes de producto
que según sus registros son 5%
defectuosos. Un cliente toma una
muestra de 200 unidades y encuentra
16 unidades defectuosas. ¿Es cierto lo
que muestran los registros del
proveedor, con =5%?
Se seguirá el procedimiento planteado. a. Planteo de la hipótesis
H0: p = 0,05 Ha: p > 0,05
b. La hipótesis es unilateral puesto que lo problemático en cuanto a calidad es que el porcentaje de defectuosos supere lo especificado.
c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:
x – np Z = –––––––
npq
ING. JORGE ACUÑA A., PhD., PROFESOR
52
e. Las áreas de cumplimiento de la hipótesis. f. Cálculo del estadístico x – np 16 – 200(0,05) Z = ———— = ––––––––––––––– = 1,95 npq 200*0,05*0,95 g. El valor de Z calculado (1,95) se encuentra
fuera del área de cumplimiento de la hipótesis nula.
h. En conclusión, no hay evidencia estadística para aceptar la hipótesis nula con = 5%. Por lo tanto, estadísticamente no es cierto lo que anotan los registros del fabricante.
ING. JORGE ACUÑA A., PhD., PROFESOR
53
Para el mismo producto del Ejemplo 3, existe otro proveedor. Una muestra de 200 unidades extraídas de un lote enviado por él, tenía 12 unidades defectuosas. ¿Se puede decir con 95% de confianza que el proveedor del Ejemplo 3 da peor calidad que el de este ejemplo.
ING. JORGE ACUÑA A., PhD., PROFESOR
54
ING. JORGE ACUÑA A., PhD.,
PROFESOR 55
SOLUCIONSOLUCION
Se seguirá el procedimiento planteado.
a. Planteo de la hipótesis
p1: fracción defectuosa del proveedor A
p2: fracción defectuosa del proveedor B
H0: p1 = p2
Ha: p1 > p2
b. La hipótesis es unilateral pues se
quiere probar si la cantidad de defectuosos
enviada por un proveedor es
significativamente mayor que la del otro.
c. El nivel de significación es dado, = 5%.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 56
SOLUCIONSOLUCION d. El estadístico por usar es:
x1 + x2
p’ = ————— q’ = 1 – p’
n1 + n2 e. Las áreas de cumplimiento
f. Cálculo del estadístico
x1 + x2 16 + 12
p’ = –––––––– = ––––––––– = 0,07
n1 + n2 200 + 200 q’ = 1 – 0,07 = 0,93 g. El valor de Z calculado (0,784) está en el área de
cumplimiento de la hipótesis nula.
h. Se puede afirmar, con =5%, que no hay diferencia
significativa entre las calidades suministradas por ambos
proveedores.
784.0
200
1
200
193.0*07.0
200
12
200
16
11''
21
2
2
1
1
Z
nnqp
n
x
n
x
Z
ING. JORGE ACUÑA A., PhD., PROFESOR
57
• En el corte de una varilla
cromada se genera una
varianza de la longitud de 2,5
mm2. Se toma una muestra de
30 varillas y se mide la varianza
muestral de la longitud, la que
resulta ser 2,0 mm2. ¿Existe
alguna diferencia significativa
con el valor inicial de 2,5 mm2?
Use =5%.
Se seguirá el procedimiento planteado. a. Planteo de la hipótesis
H0: 2 = 2,5
Ha: 2 2,5 b. La hipótesis es bilateral puesto que no se cumple con
lo requerido si la varianza de la muestra es mayor o menor que la especificada.
c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:
s2 2= (n-1) ——
2 e. Las áreas de cumplimiento de la hipótesis.
58
f. Cálculo del estadístico citado en d.
s2 2= (n-1) —— = 29 * (2/2,5) = 23,2
2
g. El valor de 2 calculado (23,2) se encuentra en el área de cumplimiento de la hipótesis nula.
h. En conclusión, se puede afirmar, con = 5%, que estadísticamente no existe diferencia con la varianza inicial.
ING. JORGE ACUÑA A., PhD., PROFESOR
59
En un proceso de corte de bolsas plásticas se usan dos máquinas. De la máquina A se toma una muestra de 30 unidades que genera una varianza en la longitud de corte de 3,3 mm2 y de la máquina B se toma una muestra de 25 unidades que genera una varianza en la longitud de corte de 4,1 mm2. ¿Se puede afirmar, con = 5%, que una máquina es mejor en la ejecución de esta operación que la otra?
ING. JORGE ACUÑA A., PhD., PROFESOR
60
Se seguirá el procedimiento planteado. a. Planteo de la hipótesis Sea 2
A la varianza producida por la máquina A 2
B la varianza producida por la máquina B H0:
2A = 2
B
Ha: 2A 2
B
b. La hipótesis es bilateral puesto se desea probar la existencia de diferencias entre las varianzas de ambas máquinas.
c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:
s12
F = ——— s2
2
ING. JORGE ACUÑA A., PhD., PROFESOR
61
e. Las áreas de cumplimiento de hipótesis. Los valores de F de
0.53 y 1.94 fueron extraídos de tablas F con /2 = 0.025. f. Cálculo del estadístico citado en d.
s12 3,3
F = ——–– = ——–– = 0,805 s2
2 4,1 g. El valor de F calculado (0,805) se encuentra en el área de
cumplimiento de la hipótesis nula (ver Figura 2.18). h. En conclusión, se puede afirmar, con =5%, que no existe
ninguna diferencia de variabilidad de la longitud de corte entre ambas máquinas.
ING. JORGE ACUÑA A., PhD., PROFESOR
62
Una inspección de calidad efectuada sobre dos marcas de baterías para linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con una desviación estándar de 1,5 horas.
Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre la vida útil de ambas marcas.
ING. JORGE ACUÑA A., PhD., PROFESOR
63
Para probar si hay diferencia significativa entre los promedios se debe comprobar primero la diferencia entre las varianzas, para así seleccionar el estadístico adecuado.
1. Hipótesis de varianzas Siguiendo los pasos de una prueba de hipótesis se tiene: a. Planteo de la hipótesis
H0: 2
A = 2B
Ha: 2A 2
B
b. Como la hipótesis alternativa es de desigualdad, entonces es bilateral. Esto significa que puede darse una relación mayor o menor.
ING. JORGE ACUÑA A., PhD., PROFESOR
64
c. El nivel de significancia es = 5%.
d. El estadístico por usar es Fc = s12/ s2
2 (distribución F-Fisher), pues lo que se desea es medir la relación de varianzas.
e. Las áreas de la hipótesis que se va a probar. v1 = n1–1 = 61–1=60 v2=n2-1 = 31–1=30 De una Tabla F con /2= 2.5% se tiene:
F 60,30,0.025 = 0,551 F 60,30,0.975 = 1,440
f. Fc= s12/ s2
2 = 1,82/1,52 = 1,44 g. Este valor calculado de Fc cae en el área donde se
cumple Ho, por lo tanto se acepta Ho.
ING. JORGE ACUÑA A., PhD., PROFESOR
65
h. Se concluye que ambas varianzas, al 5% de significancia, son iguales.
Se procede entonces a hacer la hipótesis de promedios.
Siguiendo los pasos de prueba de hipótesis se tiene: a. Planteo de la hipótesis
Ho: µ1 = µ2
Ha : µ1 µ2
b. La hipótesis es bilateral al igual que en la hipótesis anterior.
c. El nivel de significación es del 5%
ING. JORGE ACUÑA A., PhD., PROFESOR
66
d. Según la hipótesis anterior las varianzas son desconocidas pero iguales, además, los tamaños de muestra son mayores que 30. Por lo tanto el estadístico por usar es:
e. Las áreas de cumplimiento y rechazo. v = n1 + n2 – 2 v = 61 + 31 – 2 v = 90
ING. JORGE ACUÑA A., PhD., PROFESOR
67
2
2
2
1
2
1
21
n
s
n
s
xxt
De tablas se obtienen los valores: t 90, 0,025 = –1,987 t90,0,975=1,987
f. El estadístico calculado es:
En este caso ( 1 – 2) = 0 pues es de suponer que tratándose de un mismo producto las medias poblacionales son iguales.
g. No hay evidencia estadística, con = 5%, para concluir que ambas medias sean diferentes.
ING. JORGE ACUÑA A., PhD., PROFESOR
68
845,0355,0
3,0
31
5,1
61
8,1
08,365,3622
t
Permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error .
El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.
Se usa el estadístico chi-cuadrado para n>50, de lo contrario, se debe aplicar otras técnicas tales como Kolgomorov o Shapiro-Wilks
ING. JORGE ACUÑA A., PhD., PROFESOR
69
Ho : f(x) = función densidad de la distribución teórica siendo probada
Ha : f(x) a esa función Ejemplo: e– x
Ho: f(x) = p (x, ) = ––––––– x!
e– x
Ha: f(x) p (x, ) = ———— x!
Se usa el estadístico chi-cuadrado: K
2c = (nk – ek)
2 / ek
k=1
ING. JORGE ACUÑA A., PhD., PROFESOR
70
ING. JORGE ACUÑA A., PhD.,
PROFESOR 71
MUESTREO ESTADISTICOMUESTREO ESTADISTICO • Confianza en los resultados obtenidos a partir del
análisis de muestras.
• Aleatoriedad y representatividad.
• Una muestra es aleatoria cuando los elementos
que la componen fueron extraídos de una población
en la cual todos sus componentes tuvieron la misma
probabilidad de pertenecer a esa muestra.
• Una muestra es representativa cuando sus
elementos reflejan las características de la población
de la cual fueron extraídos.
• Ambas propiedades están ligadas al tamaño de la
muestra y al método usado para su selección.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 72
PROCEDIMIENTOPROCEDIMIENTO • Identificación de la característica por estudiar y
del marco de muestreo.
• Escogencia del tipo de muestreo
• Determinación del tamaño de la muestra,
mediante la fórmula que especifique el tipo de
muestreo.
• Selección aleatoria de la muestra previa
definición del procedimiento adecuado.
• Escogencia del método de estimación del error
estadístico.
• Cálculo de inferencias, errores y grado de
confianza de las conclusiones.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 73
VENTAJASVENTAJAS •Ahorro de dinero al evitar la inspección 100%, la
cual tiene costos más altos.
•Ahorro de tiempo al disminuir la cantidad por
inspeccionar en relación con la inspección 100%.
•Atención de casos individuales
•Recurso indispensable cuando la inspección es
destructiva.
•Unico método posible cuando la población es
infinita.
•Excelente opción cuando los errores no
muestrales, especialmente humanos, son grandes
e imposibles de reducir.
•Error y sesgo
ING. JORGE ACUÑA A., PhD.,
PROFESOR 74
TIPOS DE MUESTREOTIPOS DE MUESTREO
• Muestreo aleatorio simple
• Muestreo sistemático
• Muestreo estratificado
• Muestreo por conglomerados
• Muestreo de aceptación.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 75
MUESTREO ALEATORIO MUESTREO ALEATORIO
SIMPLESIMPLE • ESTIMACION DE PROMEDIOS
• ESTIMACION DE PROPORCIONES
2
2/ *
E
Zn222
2/
22
2/
**
**
ENZ
NZn
22
2/
2
2/
***
***
ENqpZ
qpNZn
2
2/*E
Zqpn
nN
nNx
2
*1 n
x
2
n
qp
N
nNx
**1
n
qpx
*
ING. JORGE ACUÑA A., PhD.,
PROFESOR 76
EJEMPLO 2.28 pag. 113EJEMPLO 2.28 pag. 113
Considérese un lote de producción de 1000
unidades, cuya varianza en el diámetro de
una de sus partes es 250 mm. Se desea
estimar el promedio del diámetro, a partir de
una muestra, con una confianza del 95% y
con error no mayor a 1 mm. ¿Cuál es ese
tamaño de muestra y su error estándar?
ING. JORGE ACUÑA A., PhD.,
PROFESOR 77
SOLUCIONSOLUCION
N = 1000 E = 1
Z /2 = 1,96 (extraído de Tablas)
2 = 250
Para estimar el promedio de diámetro de esta
pieza, se debe extraer una muestra de 481
unidades. El muestreo tiene un error estándar
de 0,52.
481~2,480)1*1000(250*96,1
250*1000*96,1
**
**2
2
222
2/
22
2/
ENZ
NZn
52,0481
250*
11000
4811000 2
x
ING. JORGE ACUÑA A., PhD.,
PROFESOR 78
EJEMPLO 2.29 pag. 113EJEMPLO 2.29 pag. 113
Un fabricante afirma que el 2,5% de los
productos que entrega el comprador son
defectuosos. Si éste recibe los productos en
lotes de 5000 unidades, ¿cuál debe ser el
tamaño de la muestra por usar para verificar
lo expresado por el fabricante? Use 95% de
confianza y un error no máximo del 1% en la
estimación.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 79
SOLUCIONSOLUCION
E = 0,01 p = 0,025 q = 0,975
N = 5000 (1- ) =0,95 Z /2 = 1,96
Lo anterior significa que para estimar el
porcentaje defectuoso de ese producto, se
debe extraer una muestra de 789 unidades.
Este muestreo tiene un error estándar de
0,005.
789)01,0*5000()975,0*025,0*96,1(
975,0*025,0*5000*96,1
***
***22
2
22
2/
2
2/
ENqpZ
qpNZn
005,0789
975,0*025,0*
15000
7895000**1 n
qp
N
nNx
ING. JORGE ACUÑA A., PhD.,
PROFESOR 80
MUESTREO MUESTREO
ESTRATIFICADOESTRATIFICADO • Los elementos poblacionales se dividen primero en k-
grupos y luego se aplica muestreo aleatorio simple
• Este proceso se llama estratificación y a cada grupo
se le llama estrato.
• Se estratifica porque los elementos poblacionales
presentan heterogeneidad, por lo que la obtención de
conclusiones representativas se hace difícil.
• Las probabilidades de selección de los estratos pueden
ser diferentes y no es necesario que todos los elementos
tengan la misma oportunidad de selección, pero se debe
conocer la probabilidad de cada uno.
• La estratificación se ejecuta de tal manera que exista
cierta homogeneidad entre los elementos de cada grupo
y que queden en igual número en cada estrato.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 81
MUESTREO MUESTREO
ESTRATIFICADOESTRATIFICADO • Afijación proporcional: se basa en el tamaño del
estrato
•Afijación óptima
k
i
iixN
NnN
nN
1
**1
**ii N
N
nn *
k
i
ii
iii
N
Nnn
1
*
2
1
2
2
1
*
*1
N
N
N
N
n
k
i
ii
k
i
ii
x
ING. JORGE ACUÑA A., PhD.,
PROFESOR 82
EJEMPLO 2.32 pag. 119EJEMPLO 2.32 pag. 119 La producción de una empresa se ha dividido en tres estratos, de
acuerdo con la fracción defectuosa que presenten. Por registros de
los últimos años se conoce la siguiente información:
–––––––––––––––––––––––––––––––––––––––––––––––––––––––
Estrato No. % Defectuoso No. Lotes i (%)
1 5 ó más 35 0,97
2 1,5 a 4,99 80 0,82
3 Menos de 1,5 15 0,30
–––––––––––––––––––––––––––––––––––––––––––––––––––––––
TOTAL 130 1,25*
* Para el total de la producción.
a. A. Si se desea tomar una muestra de 20 lotes, ¿cuántos lotes de
cada estrato se deben seleccionar?
b. B. Compare los errores estándar correspondientes con el error
estándar de muestreo aleatorio simple.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 83
SOLUCIONSOLUCION Para efectos didácticos este problema se resolverá por
afijación proporcional y por afijación óptima. En
situaciones prácticas se debe escoger el que mejor se
adapte a las condiciones.
• Afijación proporcional
––––––––––––––––––––––––––––––––––––––
Estrato Tamaño de la muestra
–––––––––––––––––––––––––––––––––––––––––––
1 n1 = (20/130) * 35 = 5,38 ³ 5
2 n2 = (20/130) * 80 = 12,3 ³ 12
3 n3 = (20/130) * 15 = 2,3 ³ 3
––––––––––––––––––––––––––––––––––––––––––––
Para completar los 20 lotes seleccionados, se deben
tomar 5 lotes del estrato 1, 12 lotes del estrato 2 y 3
lotes del estrato 3.
ING. JORGE ACUÑA A., PhD.,
PROFESOR 84
SOLUCIONSOLUCION
• Afijación óptima
Los cálculos iniciales para obtener el tamaño de
muestra por este método.
––––––––––––––––––––––––––––––––––––––––––––
Estrato Ni i Ni* i i2 Ni* i2
––––––––––––––––––––––––––––––––––––––––––––
1 35 0,97 33,95 0,94 32,93
2 80 0,82 65,60 0,67 53,79
3 15 0,30 4,50 0,09 1,35
––––––––––––––––––––––––––––––––––––––––––––
TOTALES Ni* i=104,05 Ni* i2= 88,07
–––––––––––––––––––––––––––––––––––––––––––
ING. JORGE ACUÑA A., PhD.,
PROFESOR 85
SOLUCIONSOLUCION Se calculan los tamaños de muestra de la siguiente manera:
b. Comparación de errores
El error estándar para afijación proporcional es:
186,005,104
5,4*20
1361,1205,104
6,65*20
652,605,104
95,33*20
3
2
1
n
n
n
169,0
30,0*1582,0*8097,0*35*130
1*
20*130
20130
**1
**
222
1
x
x
k
i
iixN
NnN
nN
ING. JORGE ACUÑA A., PhD.,
PROFESOR 86
SOLUCIONSOLUCION El error estándar para muestreo por afijación óptima es:
El error estándar si se usa muestreo aleatorio simple
se calcula así:
Los errores del muestreo por afijación proporcional (0,169) y
óptima (0,164) son parecidos, mientras que el error del
muestreo aleatorio simple (0,26)
164,0
130
07,88
130
05,104*
20
1
*
*1
2
2
2
1
2
2
1
x
x
k
i
ii
k
i
ii
x N
N
N
N
n
26,020
25,1*
1130
20130 2
x