Foro sobre la supervía poniente - presentación introductoria del GTX ININ
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad - Notas clase... · 2009. 3. 26. · 17...
Transcript of 17 marzo 2009 InIn 6078- Sistemas de Control de Calidad - Notas clase... · 2009. 3. 26. · 17...
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
1
Plan:
“Sequential Probability Ratio Test”
Introduccion:
SPRT se le debe a un estadístico famoso de apellido Wald, el cual el SPRT también se le
conoce como el Wald Ratio Test.
La motivación original del SPRT estuvo asociado con muestreo, el cual es un
componente de calidad que cada vez más y se va rezagando por el concepto de que el
muestreo se considera filosóficamente una técnica no preventiva.
Esto es, el grafico de control puede prevenir algunos problemas, los diseños de
experimentos pueden prevenir algunos problemas pero el muestreo cuando el asunto está
realizado ya no típicamente no previene un problema. Lo que se hace en un muestreo es
discernir si la producción o un lote estuvo razonable según un criterio pero ya no
previene, el problema ya es existente.
Como herramienta los muestreos, su aportación ha disminuido, su discusión ha
disminuido, pero sin embargo el muestreo todavía se usa en servicios o en manufacturas.
El origen den SPRT fue un origen del muestreo que después se extendió a otras áreas que
luego se hablaran aquí.
Un típico plan de muestreo para unos datos discretos es por ejemplo, tomar 125 artículos,
se inspeccionan, y si se encuentran uno o menos defectuosos, se acepta el lote, la
producción o subconjunto que se está evaluando. De igual manera se inspeccionan 800
artículos y si se encuentran 5 o menos defectuosos, se acepta el lote o subconjunto. Estos
son ejemplos de planes de muestreos típicos, discretos.
Como nos está pidiendo 800 artículos para investigar y si voy por 300 artículos y no he
encontrado ninguno defectuoso, se esperaría que en los próximos artículos que me
quedan por inspeccionar no encontrar 5 defectuosos. Entonces la pregunta importante es
el porqué llegar a los 800 artículos si ya yo tengo cierta información.
El SPRT lo que hace es que cada vez que se mira una observación de la muestra me voy a
realizar la siguiente pregunta, “con la información que tengo, ¿tengo suficiente evidencia
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
2
para rechazar?, ¿tengo suficiente evidencia para aceptar?, ¿requiero tomar más
observaciones?
En los planes de muestreo normales no son así, ya que tengo que tomar los 800 artículos
para poder tomar una decisión. En otras palabras si tengo 794 artículos inspeccionados y
por el momento tengo 0 defectuosos me quedan 6 artículos para inspeccionar para ver si
encuentro 5 defectuosos, tengo que completar los 6 artículos para inspeccionarlos.
El SPRT tiene un atractivo natural, el cual es muy probable que yo con muchos menos
datos se pueda llegar a una decisión con los mismos riesgos. No se sin suscribe a
muestreo, pues lo podemos hacer para pruebas de hipótesis y para muchas otras cosas
más.
o Si desea buscar alguna referencia acerca este tópico puede buscar un libro titulado
“Probability and Statistics” del autor Papoulis.
Cuando estudiamos pruebas de hipótesis, planes de muestreo y otras herramientas el
tamaño de muestra n se fija de antemano; muchas veces indirectamente en términos de
los errores α y β. Es una pregunta que contestamos frecuentemente o sea, cual es el
tamaño de muestra para hacer determinada prueba de hipótesis o cual es tamaño de
muestra para hacer el plan de muestreo. En otras palabras se busca un tamaño de muestra
que cumpla con algunos errores.
El enfoque de SPRT es diferente ya que se continúa la prueba hasta que la evidencia nos
muestre que debemos concluir en una dirección o en la otra (aceptar o rechazar).
En este enfoque el largo de la prueba, es decir el número de intentos hasta tomar una
decisión es una variable aleatoria. En otras palabras, no la sabemos de antemano y no
sabemos dónde vamos a concluir. Esto es a diferencia de la prueba de hipótesis donde se
establece tomar una cantidad fija de observaciones para poder decidir, en SPRT vamos
uno a uno.
Podría ser arbitrariamente grande, pero en general, usando los mismos errores, es en
promedio menor que el número requerido para una prueba de tamaño fijo.
Este método es bastante sencillo si usted conoce el método de el “Maximun Likelihood”
Vamos a mirar ahora las hipótesis:
Hipótesis para la media
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
3
Asumiendo que se tiene lo siguiente:
Típicamente las hipótesis se plantean de la siguiente forma: y .
Tomamos el siguiente cociente al que le llamamos donde m representa el tamaño de
muestra.
Se seleccionan dos constantes C0 y C1 donde C0 < C1.
En el intento m:
o Rechazamos Ho si
o Rechazamos Ho si
o Si no ocurre ninguna de las anteriores tomamos una nueva observación.
Básicamente esta es la metodología que se va a usar no importa si estamos en muestreo,
prueba de hipótesis o si estamos en una distribución discretea o función continua, todo va
a ser lo mismo.
Antes se planteaba que el cociente se puede obtener de forma recursiva.
Las constantes C0 y C1 deben ser expresadas en términos de los errores α y β.
La determinación precisa de estas constantes es compleja. Wald sugiere unas
aproximaciones que cuando son observadas tiene cierto sentido.
Cociente de probabilidad de rechazo.
Cociente de probabilidad de aceptación.
Recordando que α es la probabilidad de rechazar dado que debía aceptar y donde 1-β es
el power donde es la probabilidad de rechazar dado que debía de rechazar. Por debajo de
cero, rechazo.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
4
Recordando que 1-α es la probabilidad de aceptar dado que debía de rechazar y β es la
probabilidad de aceptar dado que debía aceptar.
Rechazo Ho
Acepto Ho
Continua
rm
C1
C0
En la grafica de arriba, en los puntos que se salen de la línea C0 o C1 se tiene evidencia
para la decisión. Se llama un ratio de cuando el parámetro esta en nivel cero o en nivel
uno.
Lo que se espera que la m cuando ocurra la decisión, sea lo suficientemente pequeña
comparada con la m cuando el tamaño de muestra es fijo.
1/C1
C0
β1
1
α + βCo = Co
α + βC1 = C1
α
(α, β)
En la región donde esta (α, β) es la región donde se puede operar. El punto donde se
encuentran ambas líneas es el punto donde se cumplen con los errores que se plantean y
en la región (α, β).
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
5
Ejemplo:
Presumimos que hacemos una prueba de hipótesis para la media. Suponga que
Δ
Rechazo Ho
No Rechazo Ho
αβ
0 0K
Se establece un límite K que nos dice cuando caemos en una región u otra, el cual su
localización es tan arbitraria como la selección de los errores.
Pensando que las medias son normales obtenemos las siguientes dos ecuaciones (usando
el Teorema del Limite Central):
Para encontrar el tamaño de muestra:
Jugando con el algebra para una y .
Esto es lo que típicamente se hace con la n fija, para cualquier prueba de hipótesis, para
la media de una media normal, cuando estamos trabajando en una prueba de hipótesis.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
6
Esto es cierto para cualquier tamaño de muestra y para cualquier prueba.
o Si la varianza aumenta la n aumenta.
o Si el proceso es mas disperso, tiene más ruido, es más difícil de distinguir una
cosa de la otra.
o Si la campana es más ancha, es más difícil distinguir entre una distribución y otra
porque habría más área de solape.
o Si la distancia que yo quiero observar (pegar las dos curvas o distribuciones) es
más pequeña, se hace más difícil de detectar.
o Si yo quiero un error más pequeño, la Z se hace más grande. Z’s mas grandes
representan errores más pequeños. Los errores más pequeños están asociados con
n más pequeños, o sea si quiero errores pequeños tengo que tomar más datos.
1
2
Lo que se hace para tomar una decisión es lo siguiente:
o Se toma una muestra de tamaño n
o Se toma el X-barra de la n.
o Si la X-barra es menor que k, no podemos rechazar o aceptamos
o Si la X-barra es mayor, rechazamos.
SPRT
Ejemplo:
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
7
Suponga que se tiene lo siguiente:
Esta protegido el productor porque quería rechazar menos veces de lo que debía aceptar,
pero no le importaba aceptar más veces de lo que debía rechazar.
La función probabilística de una normal es:
Suponemos que conocemos a σ.
El procedimiento nos pide que se haga un ratio, cuando la función está en su valor
nominal y cuando está en su valor desplazado.
El likelihood es maximizar el producto de la función:
Para poder manejar la ecuación anterior y al tener una exponencial, lo que se hace es
sacar algún logaritmo, pues estamos buscando cuando es el µ que se acepta o se rechaza.
o Nota: Un producto, al sacarle el logaritmo natural se convierte en una sumatoria.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
8
Recordado que :
=
Le tenemos que sacarle el logaritmo natural a Co y C1 porque le sacamos el logaritmo
natural al likelihood, para mantenerlo en la misma escala.
Establecemos los limites:
Decisiones:
o Si acepto Ho.
o Si voy a rechazar Ho.
o De otra forma continuo otro intento.
Haciendo varios puntos para poder graficar:
n
1 24.89 19.75
2 23.45 20.88
3 22.96 21.25
4 22.72 21.44
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
9
El promedio de alguna manera va a tender a tomar una decisión relativamente pronto ya
que el área de continuar se va achicando.
o Nota: Se continúa tomando observaciones que al final va a conformar un tamaño
de muestra.
Ejemplo (discreto-Bernoulli) (para la hipótesis)
Suponga que:
Si es una Bernoulli tenemos que :
Donde = # de éxito en el intento m
19
20
21
22
23
24
25
26
1 2 3 4
Series1 Series2
Aceptación Ho
Rechazo Ho
Continua
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
10
Donde es equivalente a la p que se está buscando.
Típicamente en los muestreos que son de naturaleza discreta el diferencial del tamaño de
muestra entre el fijo y el SPRT va a ser mayor, va a ser mucho más amplio que en los
continuos.
Existen muestreos de tipo continuo y de tipo discreto, pero en la práctica el 95% de los
muestreos que se hacen son de naturaleza discreta a pesar que el muestreo continuo es
más robusto.
Lo típico que se hace en el muestreo continuo, se tiene la curva OC que lo vimos en el
ARL, ya que el ARL y la curva OC son “primos-hermanos”.
β
P1 P2
1-α
AQL RQL
LTPD
P2, β
P1, 1-α
P = fraccion de
defectuosos
Pa
= p
robab
ilid
ad
de
acep
tar
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
11
Observando la curva OC arriba podemos encontrar dos puntos críticos que son típicos de
una curva OC.
Donde:
o P1 = AQL = Aceptable Quality Level = Es una calidad razonable, bajita en
defectuosos. En otras palabras, los lotes que vengan con esta calidad queremos
aceptarlos, pero a veces cometemos el error que es el α porciento de las veces y lo
rechazamos.
o P2 = RQL – Rejectable Quality Level = Es una calidad tan pobre, que siempre
quisiéramos rechazar, pero el β porciento de las veces cometemos el error y lo
aceptamos.
o LTPD = Lot Tolerance Percent Defective
La fracción de defectuosos va empeorando hacia la derecha de la curva, esto es, P2> P1
implicaría que hay mas defectuosos en el lote.
El concepto básico de la Curva OC es que si yo tengo una curva OC que pasa por los dos
puntos críticos establecido se tiene una protección de ambos lados:
o Se tiene la protección del productor, que no va a rechazar muchos que
consideraba bueno.
o Se tiene la protección del consumidor, que no se van a aceptar muchos que eran
malos.
Típicamente se diseña un plan que pasa por estas dos coordenadas de la Curva OC. Hay
varios métodos de hacerlo pero uno de ellos es por tanteo.
Plan discreto es determinar n (tamaño de muestra) y c (el numero de aceptación) que a
grande rasgos tomamos n objetos aleatoriamente del lote o periodo y aceptamos el mismo
si c o menos son encontrados defectuosos.
Ejemplo:
Suponga que
Diseña un plan que tenga las características mencionadas anteriormente.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
12
Por tanteo.
Es de naturaleza Binomial o Posisson.
Vamos a buscar una λ o un µ para c=0 que me dé 0.95 de probabilidad. Por tanteo
buscamos un valor para λ que me dé una probabilidad de 0.95 con X=0.
Se puede buscar la n en Binomial que de una probabilidad de 95% para X=0. El valor que
cumple esto es n=3.
Con n=3 cumple con el primer punto de la Curva OC, pero hay que cotejar el segundo
punto, el cual buscamos la probabilidad β.
El segundo punto la β da 0.77, el cual es mucho mayor que el 0.10 que es permitido. Por
lo tanto se cumple en el primer punto pero no cumple con el segundo punto.
Si
Si
Si
Con Poission
Estaría desprotegido el consumidor, porque está muy lejos de lo permitido.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
13
Desde la perspectiva fija, tenemos que llegar a 100.
Derivando el Sequential Sampling:
Se tiene el siguiente ratio:
Recordando que:
0
0.2
0.4
0.6
0.8
1
1.2
1 5 9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
10
1
10
5
10
9
OC Curve
1 3 4
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
14
Recurrimos al logaritmo nuevamente
Donde:
Donde:
Esas son las dos ecuaciones que constituyen el SPRT. Donde:
Ejemplo:
Por tanteo:
Si
Si
Se puede dejar fija c=2 y variar n.
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
15
Llegamos a la conclusión de que n=135 y C=3.
Realizandolo con las acuaciones de SPRT:
Tenemos:
Aceptación Rechazo
Recordando que:
0
0.2
0.4
0.6
0.8
1
1.2
1 61
11
62
12
63
13
64
14
65
15
66
16
67
17
68
18
69
19
61
01
10
61
11
11
61
21
12
61
31
13
6
OC Curve
0 2 3
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
16
Para ver la n mínima que necesito para resolver seria de la siguiente forma:
Si se llevan 44 inspeccionados y ninguno esta defectuosos, termino. Comparando este
valor con el n fijo de 135 inspecciones.
Si llevo dos y dos defectuosos, me paso de la línea.
Sin duda en un proceso en que la calidad es buena, no hay duda que en qué voy a
inspeccionar menos. No voy a encontrar muchos defectuosos en las 135 inspecciones que
me estaba pidiendo el otro método de actuar.
Nota:
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
Xa Xb
nX-barra = #
de
defectuosos Continuar
Rechazo
Aceptación
17 marzo 2009 InIn 6078- Sistemas de Control de Calidad
17
o Un ratio de likelihood, y no importa la estadística por ejemplo el índice de Cpk, si
se encuentra la función de probabilidad del Cpk, le aplico un likelihood. Luego
puedo saber cuándo cumple cabalmente, o no tengo idea, o no cumple con una
expectativa.
o La estadística que se quiera establecer o la hipótesis, no importa lo que importa
es que se sepa la distribución y le aplique el likelihood.
o Todos van a ser en función del mismo planteamiento, o sea, una constante que
está basada en un rechazo, y una constante que está basada en aceptación.