03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

47
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia Universidad Católica del Perú. Ensayos de Hipótesis Medir Controlar Mejorar Analizar Definir Reconocer Six Sigma Entrenamiento Green Belt

description

03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

Transcript of 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

Page 1: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayos de Hipótesis

Medir Controlar Mejorar Analizar Definir Reconocer

Six Sigma Entrenamiento Green Belt

Page 2: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Acerca de este módulo …

Six Sigma, una Búsqueda de la Perfección en los Procesos Alcanzar las Metas y Combatir la Variación

Los ensayos de hipótesis ayudan para :

Determinar si existe una diferencia real entre dos muestras relativamente pequeñas (valor p < 0.05* )

Estimar la probabilidad (valor p > 0.05*) de tener una muestra no representativa

Minimizar los riesgos asociados Alfa * y Beta

|Data File|hypothe.mtw

|Data File|hypothe2.mtw

|Data File|hypothe3.mtw

|Data File|hypothe4.mtw

\DataFile\StatTables.xls

\DataFile\SampleSize.xls

Page 3: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Qué aprenderemos ...

1. Pasos de los ensayos de hipótesis

2. Riesgos Alfa (a) y Beta (b)

3. Cálculo de tamaño de muestra

4. Usar la prueba-t para comparar dos muestras

Page 4: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Diseño:

Determinar si dos alternativas de cambio de diseño

presentan diferencias significativas.

Fabricación:

Determinar si dos materiales diferentes de suela de

zapatos se gastan igual.

Administración / Transacciones / Servicios:

Determinar la probabilidad que una muestra de un

proceso existente sea no representativa

Ejemplos del Mundo Real

Page 5: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

1. Definir el problema

2. Determinar los objetivos

3. Establecer las Hipótesis

• Hipótesis Nula (H0)

• Hipótesis Alternativa (Ha)

4. Decidir la prueba estadística más apropiada

(asumir distribución Z, t, F)

5. Establecer el nivel alfa (usualmente 5 %)

6. Establecer el nivel beta (usualmente 10-20

%)

7. Establecer el efecto de la diferencia (delta)

8. Determinar el tamaño de la muestra

9. Desarrollar el plan de muestreo

Pasos en un Ensayo de Hipótesis

10. Seleccionar muestras

11. Desarrollar el ensayo y recolectar

datos

12. Calcular el estadístico (Z, t, o F) a

partir de los datos

13. Determinar la probabilidad que el

valor del estadístico sea resultado del

azar

14. Si esa probabilidad es menor que

alfa, rechazar H0

15. Si esa probabilidad es mayor que

alfa, no rechazar H0

16. Traduzca las conclusiones

estadísticas a soluciones prácticas

Page 6: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Defina el Problema y los Objetivos

• Se debe presentar el problema clara y objetivamente:

– No presuponga soluciones

– Sea breve

– Sea específico

• Las metas, objetivos y beneficios de negocio deben ser mensurables y cuantificables.

La definición del problema y los objetivos de un ensayo estadístico es extremadamente importante!

Page 7: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ejemplo Viejo

Diseño

Nuevo

Diseño

89.7 84.7

81.4 86.1

84.8 91.9

87.3 86.3

79.7 79.3

85.1 86.2

81.7 89.1

83.7 83.7

84.5 88.5

La solución requiere revisar los fundamentos de ensayo de hipótesis!

La velocidad de transferencia de

un disco rígido es marginal. Se

propone un nuevo diseño.

Se incorpora un Reporte de

Cambio de Ingeniería (ECN)

Es mejor el nuevo diseño?

Page 8: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Los ensayos se usan para evaluar las

evidencias proporcionadas por los datos de

muestra, con el fin de poder decidir sobre un

parámetro de la población

La hipótesis nula (Ho) es la propuesta que

evaluamos.

Ho se suele presentar como: “no hay

diferencia”.

La hipótesis alternativa (Ha) se presenta

como “hay diferencia”.

No podemos rechazar Ho a menos que se

tenga una evidencia convincente para ello.

Ho

Ha

Ho

Ha

Ho p p

Ha p p

a b

a b

a b

a b

a b

a b

:

:

:

:

:

:

m m

m m

s s

s s

=

=

=

Ejemplos típicos

Establecer las Hipótesis

Page 9: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Decidir el Ensayo Estadístico Apropiado

Normal o No-normal

1 Muestra, 2 Muestras o más

Datos tipo Variable o Atributo

El parámetro estadístico a ser ensayado (m, s, median)

El Ensayo Estadístico elegido depende de nuestro objetivo y

la calidad de datos existentes :

El Árbol de Decisión del Ensayo de Hipótesis ayuda en decidir que

tipo de ensayo realizar!

Page 10: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Árbol de decisión de los Ensayos de Hipótesis

Ho: M1=M2=M3…

Ha: Al menos 2 son differentes

Minitab: Stat-Nonparametric-Mann-Whitney (or)

Stat-Nonparametric-Kruskal-Wallis (or)

Stat-Nonparametric-Freidmans

M1=Median sample 1, etc.

Ho: M1 = objetivo Ha: M1 objetivo

Minitab: Stat-Nonparametric-1 Sample - sign (or)

Stat-Nonparametric-1 Sample Wilcoxon

(Usado también con datos emparejados Ho: M1-M2=0)

M1=Median or sample 1

M target = Target Median

Ensayos de

Hipótesis

Datos Continuos

(Un solo factor)

Datos de

Atributos

Tabla de Contingencia

Prueba de Proporciones (Solo 2 factores)

Ho: 2 factores son independientes

Ha: 2 factores son dependientes

Minitab: Stat-tables-Chi square test

Ho: P1=P2 Ha: P1 P2

Minitab: Stat-Basic Stat-1or 2 proportions

Test de Normalidad

Ho:s1=s2=s3…

Ha: Al menos 1 es diferente

Minitab: Stat-ANOVA-Test for Equal Variances

Para sólo 2 s, esto es similar a un F-test: F=(S1)2/(S2)2

Si Fcalc>Fcrit, rechazar Hipótesis nula

(Usar Chi-Squared para 1 muestra)

Normal

2 ó más muestras

Test de Levene

2 ó más muestras

1 Muestra

Ho: Datos Normales

Ha: Datos NO Normales

Minitab: Stat-Basic Stat-Normality Test

Usar Anderson-Darling

Chi-Cuadrado Test de Bartlett

No-normal

1 Muestra 2 ó más Muestras

1 Sample T Test

Paired T Test (Variance =)

One Way ANOVA

2 Sample T Test

Ho: s1=sobjetivo Ha: s1 s objetivo

Minitab: Stat-Basic Stat-Display Desc Stat-

Graphical Summary

Si sobjetivo cae dentro de CI: no rechazamos Ho

Ho: m1=mobjetivo Ha: m1 mobjetivo

Minitab: Stat-Basic Stat-1 Sample-T

(Usado también con datos apareados :Ho: m1=m2=0)

Ho:s1=s2=s3… Ha: s1 al menos 2 son diferentes

Minitab: Stat-ANOVA-Test for Equal Variances

Para solo 2 ss, es igual que F-test:

Stat>BasicStat>2 Variances

F=(S1)2/(S2)2

Si Fcalc>Fcrit, rechaza Ho

Ho: m1=m2=m3=…

Ha: m1 al menos 2 son diferentes

Minitab: Stat-ANOVA-One Way

(Cuidado: Bartlett’s p<0.005;

asume=varianzas)

Ho: m1=m2 Ha: m1 m2

Minitab: Stat-Basic Stat-2 Sample-T

(Compara medias usando Std Dev global)

Seleccionar varianzas iguales o

Seleccionar varianzas diferentes

2 Muestras

Ho: m1-m2=0 Ha: m1-m2 0

Minitab: Stat-Basic Stat-Paired T

(Compara medias cuando las

observaciones están apareadas)

1 Sample Z Test

Ho: m1=mobjetivo Ha: m1 mobjetivo

Minitab: Stat-Basic Stat-1 Sample-Z

(Usado también con datos apareados: Ho:m1=m2=0)

Tamaño de muestra >=30 s conocida

Page 11: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tipos de Ensayos de Hipótesis: Una Muestra

1 Prueba Z para 1 muestra Se usa para calcular el intervalo de confianza o realizar un

ensayo de hipótesis de la media, cuando s es conocida

Para una prueba a dos colas y una muestra Z

Tamaño de muestra (n) mayor o igual a 30

Prueba t para 1 muestra Se usa para calcular el intervalo de confianza o realizar un

ensayo de hipótesis de la media

s es desconocida

Para una prueba a dos colas y una muestra t

Tamaño de muestra (n) menor que 30

1

La filmina en inglés hablaba de s conocida, pero entiendo que corresponde σ conocida

Page 12: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tipos de Ensayos de Hipótesis: 2 Muestras

Prueba t para 2 muestras Se usa para comparar dos muestras y determinar si existen diferencias

en las medias

Para una prueba a dos colas y dos muestras t

s es desconocida

Prueba t para datos apareados Se usa para calcular el intervalo de confianza y realizar el ensayo de

hipótesis de la diferencia entre las medias de población cuando las

observaciones están apareadas.

Este procedimiento se ajusta a aquellas respuestas en que existe

dependencia o relación entre pares de valores.

Esta dependencia hace que la variación entre los pares resulta en

errores de menor magnitud, con el consiguiente aumento en la

sensibilidad del ensayo o el intervalo de confianza.

2

2

Page 13: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Típicamente, se fija este

riesgo en un 5%.

Riesgos Alfa y Beta; Errores Tipo I y II

Los errores tipo I se cometen

cuando rechazamos la

hipótesis nula y ésta es cierta

Los errores tipo II se cometen

cuando no rechazamos la

hipótesis nula y ésta es falsa.

El riesgo (a) es la probabilidad

de cometer un error tipo I.

Los riesgos se fijan “a priori”, antes de realizar el experimento.

Típicamente, se fija este

riesgo en un 10%.

El riesgo (b) es la probabilidad

de cometer un error tipo II.

Page 14: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ho no rechazada Ho rechazada

Ho no debería

rechazarse

(Ho es cierta)

Decisión

correcta

Error Tipo II, o

Riesgo del

Consumidor

b = P (Tipo II)

Ho debería

rechazarse

(Ho es falsa)

Error Tipo I, o

Riesgo del

Productor

a = P (Tipo I)

Decisión

correcta

a es el riesgo de encontrar una diferencia cuando realmente no existe.

b es el riesgo de no encontrar una diferencia cuando sí existe.

Acción

La “Verdad”

La Tabla Verdad de los Riesgos

Page 15: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Recuerde:

a es el riesgo de encontrar una diferencia cuando realmente no existe.

b es el riesgo de no encontrar una diferencia cuando sí existe.

b a

Ho Ha

Ahora podemos determinar si el ECN mejoró el desempeño.

Otra forma de ver los Riesgos

Page 16: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Las Poblaciones tienen

parámetros :

Media - m

Desviación Estándar - s

Cantidad de ítems - N

Las Muestras tiene

estadísticos:

Promedio - X

Desvío Estándar - s

Tamaño de muestra - n

Típicamente sacamos conclusiones de una población basándonos en las muestras

Por lo tanto, siempre hay un grado de incertidumbre en estas conclusiones.

La determinación de la “Potencia” nos permite cuantificar esa incertidumbre.

Recuerde de Estadística Básica

Page 17: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Establecer el efecto del tamaño

Siempre existe una “solución de compromiso” entre:

1. La confianza que podemos tener de nuestra conclusión

2. Grado de diferencia del sigma requerido para ser detectado (relativo a la distribución de las poblaciones)

3. Tamaño de muestra

Page 18: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Un Ratio bajo entre la diferencia entre las medias y la desviación

estándar implica que:

Se necesita un tamaño de muestra considerable para detectar si

existe una diferencia entre las medias de la población, ya que…

La probabilidad de extraer un gran número de individuos de las

áreas no solapadas es relativamente baja.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Unidades de Medición

Ilustración 1

Page 19: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ilustración 2 Un Ratio alto entre la diferencia entre las medias y la desviación

estándar implica que:

Se necesita una muestra relativamente pequeña para determinar

que existe una diferencia entre las poblaciones ya que…

La probabilidad de extraer un gran número de individuos de las

áreas no solapadas es relativamente alta

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Unidades de Medición

Page 20: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Unidades de Medición

Si el valor de la diferencia entre las medias a detectar es grande

relativo al valor de la desviación estándar de las poblaciones, es

más fácil detectar las diferencias, porque la probabilidad de extraer

individuos de las áreas no solapadas es relativamente grande.

Ilustración 3

Page 21: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

2

2

/ 2 22 ( )n Z Za b

s

=

Tabla de selección de tamaño de muestra para t-test de 2 muestras

\DataFile\SampleSize.xls (2-tailed test) 20% 20% 20% 20% 10% 10% 10% 10% 5% 5% 5% 5% 1% 1% 1% 1% a

/s 20% 10% 5% 1% 20% 10% 5% 1% 20% 10% 5% 1% 20% 10% 5% 1% b

0.1 902 1314 1713 2603 1237 1713 2164 3154 1570 2101 2599 3674 2336 2976 3563 4806

0.2 225 328 428 651 309 428 541 789 392 525 650 919 584 744 891 1202

0.3 100 146 190 289 137 190 240 350 174 233 289 408 260 331 396 534

0.4 56 82 107 163 77 107 135 197 98 131 162 230 146 186 223 300

0.5 36 53 69 104 49 69 87 126 63 84 104 147 93 119 143 192

0.6 25 36 48 72 34 48 60 88 44 58 72 102 65 83 99 134

0.7 18 27 35 53 25 35 44 64 32 43 53 75 48 61 73 98

0.8 14 21 27 41 19 27 34 49 25 33 41 57 36 46 56 75

0.9 11 16 21 32 15 21 27 39 19 26 32 45 29 37 44 59

1 9 13 17 26 12 17 22 32 16 21 26 37 23 30 36 48

1.1 7 11 14 22 10 14 18 26 13 17 21 30 19 25 29 40

1.2 6 9 12 18 9 12 15 22 11 15 18 26 16 21 25 33

1.3 5 8 10 15 7 10 13 19 9 12 15 22 14 18 21 28

1.4 5 7 9 13 6 9 11 16 8 11 13 19 12 15 18 25

1.5 4 6 8 12 5 8 10 14 7 9 12 16 10 13 16 21

1.6 4 5 7 10 5 7 8 12 6 8 10 14 9 12 14 19

1.7 3 5 6 9 4 6 7 11 5 7 9 13 8 10 12 17

1.8 3 4 5 8 4 5 7 10 5 6 8 11 7 9 11 15

1.9 2 4 5 7 3 5 6 9 4 6 7 10 6 8 10 13

2 2 3 4 7 3 4 5 8 4 5 6 9 6 7 9 12

Page 22: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

\DataFile\SampleSize.xls

Relación de Delta/Sigma respecto del Tamaño de Muestra

a = .05 b = .1

1

10

100

1000

10000

0.1

0.4

0.7 1

1.3

1.6

1.9

2.2

2.5

2.8

3.1

3.4

3.7 4

Delta/Sigma

Sa

mp

le s

ize

Page 23: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Pasos en la selección de Tamaño de Muestra

1. Seleccionar riesgo a

2. Seleccionar riesgo b

– Nota: Potencia = 1- b

3. Seleccionar (delta, la diferencia que se quiere detectar)

Page 24: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tamaño de Muestra para el ejemplo de ingeniería

1. Sea riesgo a = 5% (95% Confianza)

2. Sea riesgo b = 10%

– Nota: potencia = 1- b = 90%

3. Ingeniería determinó que el delta () (la diferencia a detectar)

debe ser 1.5 sigma ( / s =1.5)

Page 25: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Cálculo de tamaño de muestra

De la tabla SampleSize.xls , Tab: 2 Sample t Table… a = 5%

b =1 0%

…El tamaño de muestra necesita ser mayor o igual a 9, que es lo que ingeniería proveyó!

Old Design New Design

89.7 84.7

81.4 86.1

84.8 91.9

87.3 86.3

79.7 79.3

85.1 86.2

81.7 89.1

83.7 83.7

84.5 88.5

/s = 1.5

Page 26: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

a b D o n

Constant Constant

Constant Constant

Constant Constant

Constant Constant

Constant Constant

Constant Constant

Resumen de relaciones

2

2

/ 2 22 ( )n Z Za b

s

=

Page 27: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tamaño de muestra usando Minitab : Ejemplo 1

Desarrollo: • Abra Minitab • Vaya a Stat > Basic Stat >

Power and Sample Size > 2-sample t

• El cuadro de diálogo Power and Sample Size for 2-Sample t aparecerá como se muestra

Un Green Belt debe llevar a cabo un t-test de dos muestras.

Quiere detectar un efecto estandarizado, /s, de 1.5.

El Green Belt decide un riesgo alfa de 5%. Alfa es el riesgo de

decir que existe un efecto cuando en realidad no existe..

El Green Belt decide un riesgo beta de 20%.

Beta es el riesgo de decir que no existe un efecto cuando en

realidad existe.

Page 28: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tamaño de muestra usando Minitab : Ejemplo 1 (Continuación)

1. Sigma es 1.0 porque estamos

usando un efecto estandarizado

2. Tipee el efecto estandarizado de

1,5 en Differences:

3. Tipee 0.80 en Power values: y

agregue 0.90, 0.95, 0.99 para ver

los tamaños de muestra requeridos

por una mayor potencia

4. Seleccione OK

5. Nota: podemos especificar

cualesquiera de dos valores y

obtener el tercero

1

5

4

3

Potencia es la probabilidad

de detectar el efecto, si

existe

Page 29: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tamaño de muestra usando Minitab : Ejemplo 1 (Continuación)

La Ventana de Sesión Minitab muestra los resultados del análisis

estadístico :

La solución Minitab difiere de la Tabla porque Minitab usa la distribución t y la tabla usa la distribución normal, como aproximación.

Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Assumed standard deviation = 1 Sample Target Difference Size Power Actual Power 1.5 9 0.80 0.847610 1.5 11 0.90 0.916899 1.5 13 0.95 0.956112 1.5 18 0.99 0.992017

Page 30: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Llevando a cabo un t-test usando Minitab:

Ejemplo 2 • El Green Belt quiere determinar si un nuevo diseño es

diferente respecto a un viejo diseño por más de un efecto estandarizado de 1.5. El riesgo alfa es 5%.

• El Green Belt extrae 9 muestras del viejo diseño y 9 muestras del nuevo diseño.

• Hipótesis:

0

OldDesign NewDesign

89.7 84.7

81.4 86.1

84.8 91.9

87.3 86.3

79.7 79.3

85.1 86.2

81.7 89.1

83.7 83.7

84.5 88.5

OLDNEWa

OLDNEW

:H

:H

mm

m=m

a/2 a/2

Page 31: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)

• Los supuestos para un t-test de dos muestras son:

− Ambas muestras están distribuidas normalmente

− Ambas muestras tienen igual varianza

• Use Minitab para comprobar la normalidad

• Deje que Minitab decida si las varianzas son iguales

Desarrollo: Abra archivo HYPOTHE

Vaya a Stat > Basic

Statistics > Normality

test…

El cuadro de diálogo

Normality Test aparecerá

como se muestra

Hacerlo para el Viejo y el

Nuevo diseño

Page 32: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

NewDesign

Pe

rce

nt

9692888480

99

95

90

80

70

60

50

40

30

20

10

5

1

Mean

0.647

86.2

StDev 3.576

N 9

AD 0.251

P-Value

Probability Plot of NewDesignNormal

OldDesign

Pe

rce

nt

92.590.087.585.082.580.077.575.0

99

95

90

80

70

60

50

40

30

20

10

5

1

Mean

0.840

84.21

StDev 3.076

N 9

AD 0.197

P-Value

Probability Plot of OldDesignNormal

Ambos valores p son mayores a 0.05, se asume que los datos son normales.

Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)

Page 33: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

1. Indique Samples in

different columns

2. Resalte C1 Old Design

3. Presione Select

4. Aparecerá Old Design

en la ventana First.

5. Repita los pasos 2, 3, y

4 para C2 New Design

6. Seleccione Options

Vaya a Stat>Basic Statistics>2-Sample t… .

El cuadro de diálogo 2-Sample t (Test and Confidence Interval)

aparecerá como se muestra

1

2

3

6

5 4

NO asuma varianzas iguales

Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)

Page 34: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

1. Verifique Confidence

level: (debería ser

1 – alfa)

2. Verifique Alternative:

(esta es la hipótesis

alternativa—muestra

como considerará la

distribución alternativa

si la hipótesis nula es

falsa)

3. Seleccione OK

4. Seleccione OK de

nuevo en el cuadro de

diálogo 2-Sample t

Distribución Nula

Distribuciones alternativas posibles

1

2

3

Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)

Page 35: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

La Ventana de Sesión de Minitab muestra los resultados del

análisis estadístico :

p-value > 0.05: no se puede rechazar Ho

Two-Sample T-Test and CI: OldDesign, NewDesign Two-sample T for OldDesign vs NewDesign N Mean St Dev SE Mean OldDesign 9 84.21 3.08 1.0 NewDesign 9 86.20 3.58 1.2 Difference = mu (OldDesign) - mu (NewDesign) Estimate for difference: -1.98889 95% CI for difference: (-5.34050, 1.36273) T-Test of difference = 0 (vs not =): T-Value = -1.26 P-Value = 0.225 DF = 15

Llevando a cabo un t-test usando Minitab: Ejemplo 2 (Continuación)

Page 36: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Llevando a cabo un t-test usando Minitab: Ejemplo 3

1. Indique Samples in

difference columns

2. Resalte C1 Old Design

3. Presione Select

4. Old Design aparecerá

en la ventana First

5. Repita pasos 2, 3, y 4

para C2 New Design

6. Seleccione Options

Supongamos que queremos determinar si el Nuevo Diseño es más

grande que el Viejo Diseño, eso es mOLD < mNEW ?

1

2

3

6

5 4

NEWOLDa

NEWOLD0

:H ,

:H ,

mm

mm

aAlternativHipótesis

NulaHipótesis

NO asuma varianzas iguales

Page 37: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

1. Verifique Confidence

level: (debería ser 1 – α)

2. Verifique Alternative:

(esta es la hipótesis

alternativa—muestra

como considerará a la

distribución alternativa si

la hipótesis nula es falsa)

3. Seleccione OK

4. Seleccione OK de nuevo

en el cuadro de diálogo 2-

Sample t

Distribución Nula

Distribución alternativa

1

2

3

Llevando a cabo un t-test usando Minitab: Ejemplo 3 (Continuación)

Page 38: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

La Ventana de Sesión de Minitab muestra los resultados del análisis estadístico :

p-value > 0.05: no se puede rechazar Ho

Two-Sample T-Test and CI: OldDesign, NewDesign Two-sample T for OldDesign vs NewDesign N Mean St Dev SE Mean OldDesign 9 84.21 3.08 1.0 NewDesign 9 86.20 3.58 1.2 Difference = mu (OldDesign) - mu (NewDesign) Estimate for difference: -1.98889 95% upper bound for difference: 0.76771 T-Test of difference = 0 (vs <): T-Value = -1.26 P-Value = 0.113 DF = 15

Si la prueba pasa el test de 2 colas , pasará el de 1 cola. Esto puede simplificar mucho el análisis.

Llevando a cabo un t-test usando Minitab: Ejemplo 3 (Continuación)

Page 39: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayo de Hipótesis: Ejercicio 1

Conocemos que el tiempo promedio para procesar una orden de

cliente es 4.36 horas. El tiempo de procesamiento de órdenes es un

parámetro de cliente Crítico al Despacho. Cuanto más rápido, mejor.

Se ha propuesto un nuevo proceso. Es el nuevo proceso, al menos,

tan bueno como el viejo proceso?

Deseamos detectar un cambio de 1 hora, y la desviación estándar

histórica del proceso es 1 hora.

Nuestro riesgo beta es 20%, y el riesgo alfa, 5%.

Cuál debe ser nuestro tamaño de muestra?

Nota: ya que este va a ser un test de una sola cola, el tamaño de muestra será menor que para uno de dos colas. Sin embargo, si el nuevo proceso es más rápido que el actual, deseamos detectar el cambio de una hora (negativa); ello es, el efecto de -1 hora. Si no usamos “-1”, Minitab nos dará un mensaje de error.

Page 40: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayo de Hipótesis: Solución al Ejercicio 1

Power and Sample Size 2-Sample t Test Testing mean 1 = mean 2 (versus <) Calculating power for mean 1 = mean 2 + difference Alpha = 0.05 Assumed standard deviation = 1 Sample Target Difference Size Power Actual Power -1 14 0.80 0.824086 -1 18 0.90 0.902272 -1 23 0.95 0.954817 -1 33 0.99 0.991195

Page 41: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayo de Hipótesis: Ejercicio 2

• Conocemos que el tiempo promedio para procesar una orden de cliente es 4.36 horas. El tiempo de procesamiento de órdenes es un parámetro de cliente Crítico al Despacho. Cuanto más rápido, mejor

• Se recolectaron datos para el nuevo proceso. Es el nuevo proceso más rápido que el viejo?

• Abrir archivo HYPOTHE2.

Nota: este es un 1 Sample t-test, donde el estándar (media del test = 4.36 horas) puede ser tratada como la Hipótesis alternativa Ha

Tiempo de proceso 3.79440 3.78220 3.82508 3.97836 3.73360 3.88021 3.93502 3.92548 3.89989 3.73931 3.71954 3.81429 3.86097 3.81711

Page 42: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayo de Hipótesis: Solución al Ejercicio 2

1. Resalte C1 Order Time

2. Presione Select 3. Aparecerá Order Time

en la ventana Variable 4. Tipee 4.36 en Test

mean: 5. Seleccione Options

1

2

3

4

5

Seleccione 1-Sample t (Test and Confidence Interval)

Page 43: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Ensayo de Hipótesis: Solución al Ejercicio 2 (Cont)

1. Verifique Confidence level:

2. Seleccione less than en Alternative:

3. Seleccione OK 4. Seleccione OK en

cuadro de diálogo 1-Sample t

p-value <= 0.05: se rechaza la hipótesis nula

One-Sample T: Order Time Test of mu = 4.36 vs < 4.36 95% Upper Variable N Mean St Dev SE Mean Bound T P Order Time 14 3.83610 0.08024 0.02145 3.87408 -24.43 0.000

Page 44: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Que hemos aprendido ...

1. Pasos en el Ensayo de Hipótesis

2. Riesgos Alfa (a) y Beta (b)

3. Calcular Tamaño de Muestra

4. Usar el t-test para comparar dos medias

Page 45: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Tarea para el hogar

1. Se evalúan dos procesos de facturación para determinar cuál lo hace en menor tiempo. Qué proceso seleccionaría y por qué? \DataFile\HYPOTHE3.mtw

2. Se comparan los diseños de dos receptores respecto a su ganancia. Se toman diez muestras de Producción y de Productos Terminados, que representan la variación total existente en la fábrica. Cada receptor es ensayado y luego modificado con el nuevo diseño. Qué diseño elegiría y por qué? \DataFile\HYPOTHE4.mtw

Analice los siguientes problemas, y prepárese para exponer sus

conclusiones y razonamiento que le condujo a ellas:

Page 46: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Material Suplementario

Page 47: 03 Analyze W1 Hypothesis Testing Sp. Six sigma Analyze

INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia

Universidad Católica del Perú.

Primero se calcula el estadístico del ensayo: Donde:

0 es la diferencia que tratamos de detectar (típicamente 0)

s(x1-x2) es el error estimado de la diferencia entre las dos medias

Si asumimos igual varianza para ambas muestras, • se calcula una varianza global (“pooled”) que depende del tamaño de

la muestra (ver Ayuda de Minitab: Calculations for Two Sample t-Tests),

A continuación se calcula el valor de t crítico: tcrit=tα/2,DF

DF = n1+ n2 -2 para estimación “pooled” ( varianzas iguales)

DF =

Si t > tcrit , rechazar la hipótesis nula

Finalmente se calcula un valor de probabilidad: Si esta probabilidad es menor que el valor a elegido, se rechaza la

hipótesis nula

¿Cómo funciona una prueba t para dos muestras?

2

2

2

1

2

1

2

2

2

2

2

1

2

1

2

12

2

2

2

1

2

1 s 11 n

s

n

s

n

n

s

n

n

s

n

s

n

s=

21

021

xxs

xxt

=

(varianzas desiguales)