Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más...

23
Capítulo 11 Diseño de experimentos factoriales a dos niveles 1. Introducción 2. El diseño 2 2 3. El diseño 2 k 4. Fracciones de diseños factoriales 1 Apuntes realzados por el Profesor Ismael Sánchez para la asignatura: Métodos Estadísticos para la Mejora de la Calidad, de la titulación de Ingeniería de Telecomunicaciones. Universidad Carlos III de Madrid 1

Transcript of Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más...

Page 1: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

Capítulo 11

Diseño de experimentos factorialesa dos niveles

1. Introducción

2. El diseño 22

3. El diseño 2k

4. Fracciones de diseños factoriales

1Apuntes realzados por el Profesor Ismael Sánchez para la asignatura: Métodos Estadísticos para la Mejora dela Calidad, de la titulación de Ingeniería de Telecomunicaciones. Universidad Carlos III de Madrid

1

Page 2: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

2 Diseño de experimentos factoriales a dos niveles

11.1. IntroducciónEn los dos capítulos anteriores tratamos el análisis de los datos que resultaban al realizar un

conjunto de experimentos. En este capítulo estudiaremos cómo diseñar el experimento con el finde analizar el máximo número de factores con el mínimo número de datos. La motivación general esque la obtención de datos reales por medio de experimentos puede ser muy caro. Por tanto, hemosde optimizar el coste del experimento. Para ello, una estrategia habitual es realizar experimentoscon sólo dos niveles para cada uno de los factores a considerar. Por ejemplo:

Tipo de motor: con/sin catalizador

Temperatura: alta/baja

Reactivo químico: en cantidad Q1 ó Q2

Circuitos: con componentes tipo I o tipo II

Voltaje: V1 ó V2

Potencia: P1 ó P2

Este tipo de diseños es muy frecuente en la industria debido al alto coste que puede suponer laexperimentación y al elevado número de experimentos que serían necesarios si estamos interesadosen muchos factores con muchos niveles. Por ejemplo, un diseño de 5 factores con 5 niveles cada unorequiere la realización de 55 = 3125 experimentos. El objetivo, por tanto, es detectar qué factoresson significativos (o interacciones entre factores) realizando un número mínimo de experimentos.Posteriormente, se pede pasar a realizar un experimento más exhaustivo sólo con los factoresque en esta primera etapa hayan resultado significativos. En la literatura inglesa a este tipo deexperimentos se le denomina ’screening designs’, o diseños prospectivos, por su carácter preliminar.

11.2. El diseño 22

11.2.1. Tabla estándar y ecuación de regresión

Este es el caso más sencillo de diseños factoriales a dos niveles. En la notación 22, el exponenteindica el número de factores: 2; mientras que la base indica los niveles de cada factor: también 2.El diseño consta de dos factores: el factor A y el factor B. Ambos factores tienen dos niveles: elnivel (—) y el nivel (+). Si el factor es cuantitativo, el nivel (+) representa al nivel superior y el (—)al inferior. Si el factor es del tipo presencia/ausencia de cierto atributo, el nivel (+) representa lapresencia del atributo y (−) la ausencia. En cualquier otro caso, la asignación del nivel (+) o (−)es arbitraria. El diseño consta, entonces, de 4 experimentos según las cuatro combinaciones de lossignos de los factores (factor A, factor B). Sea y la variable respuesta. Se suele denominar con laletra o al valor de y correspondiente a la combinación (—,—); con a a la combinación (+,—); con ba la combinación (—,+); y ab a la combinación (+,+). El diseño se puede resumir en la siguientetabla, donde cada fila es un experimento distinto:

Factor A Factor B Respuesta y− − y11(o)+ − y21(a)− + y12(b)+ + y22(ab)

(11.1)

Page 3: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.2 El diseño 22 3

Cuando la secuencia de signos es como aparece en la tabla, recibe el nombre de configuracióno tabla estándar: el factor A alterna los signos comenzando con el (—), mientras que el B cambiade signo cada dos experimentos y comienza por el (—). El subíndice de y es 1 si el factor está en elnivel (—), y 2 si está en el (+).

Ejemplo 1:

Una empresa de componentes electrónicos desea saber qué factores afectan a la variabilidadde sus resistencias eléctricas. Dicha variabilidad se mide con la diferencia entre el valor real y elnominal (en Ohmios). Se realiza un primer experimento con 4 resistencias de valor nominal 100Ω. Los factores que se controlan son:

Factor A: Temperatura: (-) 15oC (+) 60oC

Factor B: Vida del componente: (-) sin usar (+) 1000 horas de uso

Los valores obtenidos para las cuatro resistencias analizadas (variable y =diferencia entre valorreal y nominal (100 Ω)) son los siguientes

Factor A Factor B Respuesta y− − y11(o) = 3+ − y21(a) = 15− + y12(b) = 20+ + y22(ab) = 34

El modelo que sigue la variable y en este diseño es:

yij = μ+ αi + βj + (αβ)ij + uij ; i, j = 1, 2 (11.2)

y es un caso particular de los diseños factoriales vistos en el tema anterior. Al existir sólo dos niveles,merece la pena encontrar una expresión simplificada alternativa de este modelo, que permita unanálisis más sencillo. El valor de yij en cada celda de la tabla de dimensión 2×2 puede expresarsede la siguiente forma:

Factor A− +

Factor B − y11 y21+ y12 y22

=− +

− μ μ+ μ μ +

− +− α1 α2+ α1 α2

+− +

− β1 β1+ β2 β2

+− +

− (αβ)11 (αβ)21+ (αβ)12 (αβ)22

+− +

− u11 u21+ u12 u22

Como αi representa desviaciones respecto al valor medio μ se verifica que

α1 + α2 = 0⇒ α1 = −α2

Page 4: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

4 Diseño de experimentos factoriales a dos niveles

Por tanto

− +− α1 α2+ α1 α2

≡− +

− −α2 α2+ −α2 α2

Análogamente:β1 + β2 = 0⇒ β1 = −β2

y, por tanto

− +− β1 β1+ β2 β2

≡− +

− −β2 −β2+ β2 β2

Los parámetros de la interacción (αβ)ij también suman cero por filas y columnas, por tanto:

− +− (αβ)11 (αβ)21+ (αβ)12 (αβ)22

≡− +

− (αβ)22 −(αβ)22+ −(αβ)22 (αβ)22

Por tanto, se cumple que:

Factor A− +

Factor B − y11 y21+ y12 y22

=− +

− μ μ+ μ μ +

− +− −α2 α2+ −α2 α2

+− +

− −β2 −β2+ β2 β2

+− +

− (αβ)22 −(αβ)22+ −(αβ)22 (αβ)22

+− +

− u11 u21+ u12 u22

y basta, entonces, un sólo parámetro para describir el efecto de cada componente de la variabili-dad explicada (factor o interacción). Definamos ahora las siguientes variables dicotómicas (variabledicotómica= que sólo toma dos valores):

DA =

½+1 si el Factor A está al nivel (+)−1 si el Factor A está al nivel (—)

DB =

½+1 si el Factor B está al nivel (+)−1 si el Factor B está al nivel (—)

Utilizando estas variables, el modelo (11.2) puede escribirse de la siguiente manera:

yij = μ+ α2DA + β2DB + (αβ)22DA ×DB + uij .

A esta representación se le denomina Ecuación o Modelo de Regresión. Por ejemplo, parala observación y11 se tiene que ambos factores toman valor (—). Se tiene entonces que DA = −1,DB = −1 y DA ×DB = +1, y la ecuación de regresión toma el valor

y11 = μ− α2 − β2 + (αβ)22 + u11.

Page 5: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.2 El diseño 22 5

11.2.2. Estimación

La estimación de los parámetros se hace de la misma manera que se definió en los temasanteriores. Por tanto:

μ =

P2j=1

P2i=1 yij

4

α2 =

P2j=1 y2j

2− μ

β2 =

P2i=1 yi22

− μ

La interacción en la celda (i, j) es

(αβ)ij = E(yij |para i, j)− μ− αi − βj

donde, al existir una sola observación en cada celda, la estimación de E(yij |para i, j) será dichaobservación. Por tanto:

[(αβ)22 = y22 − μ− α2 − β2.

En este modelo sin replicaciones, la interacción de orden 2 coinciden con los residuos, por lo quesu estimación nos deja sin información para calcular la VNE, lo que implicaría que la variabilidadde y se explicaría totalmente, sin error, con esos dos factores. No se tiene, entonces, informaciónpara realizar contrastes. No obstante, a nivel teórico tiene interés incluir aquí su estimación, y asídefinir de forma fácil la notación y propiedades que serán de utilidad para modelos más complejosen los que sí exista interés en estimar la interacción.

Se define Efecto de un factor o interacción al incremento esperado en la variable respuestaal pasarse del nivel (—) al nivel (+). Se tiene entonces que:

Efecto del Factor A≡ α = α2 − α1 = 2α2

Efecto del Factor B≡ β = β2 − β1 = 2β2

Efecto de la interacción ≡ αβ = (αβ)22 − (αβ)12 = 2(αβ)22Al efecto de los factores se les denomina también efectos principales. Puede demostrarse que

la estimación de los efectos, tanto principales como interacciones, son independientes entre si. Estaindependencia procede de la ortogonalidad de las columnas; es decir, que el producto escalar decualquier par de columnas (con +1 en lugar de +, y -1 en lugar de —) es nulo. Por ejemplo

A×B = (−1)× (−1)+ (+1)× (−1)+ (−1)× (+1)+ (+1)× (+1) = 0.

Con los datos del Ejemplo 1 se tiene:

μ = 18

α2 = 6,5

β2 = 9

[(αβ)22 = 0,5

Page 6: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

6 Diseño de experimentos factoriales a dos niveles

Figura 11.1: Diagrama de Pareto para los efectos del Ejemplo 1.

y la ecuación de regresión es:

yij = 18 + 6,5DA + 9DB + 0,5DA ×DB

donde no hay residuos porque coinciden con el efecto de la interacción. El efecto de cada factor es:

Media global=18

Factor A: Temperatura=13

Factor B: Componente=18

Interacción=1

Es habitual representar estos efectos, en valor absoluto, en un diagrama de Pareto, donde losefectos se ordenan de mayor a menor magnitud (en valor absoluto). La figura 11.1 muestra eldiagrama de Pareto para los efectos del ejemplo 1.

La figura 11.2 muestra los gráficos de efectos principales e interacciones de este ejemplo.Puedeverse que la interacción parece poco relevante, al ser las rectas del gráfico casi paralelas. En esteejemplo, no hay datos suficientes para estimar los residuos, por lo que no podemos hacer contrastes.Estimamos 4 parámetros con 4 datos y, por tanto, no hay grados de libertad para los residuos.

Otra forma alternativa y simple de obtener las estimaciones de los efectos de los factores,totalmente equivalente a la anterior, es aplicando el llamado criterio de los signos. Este criterioconsiste en obtener las estimaciones aplicando las columnas de signos de la tabla estándar (11.1)a la columna de datos. Por ejemplo, el efecto de Factor A, α, es el incremento entre el nivel (+) y

Page 7: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.2 El diseño 22 7

Main Effects Plot

Var

iabi

lidad

de

las r

esis

tenc

ias

Temperatura-1,0 1,0

Vida del comp.-1,0 1,0

9

12

15

18

21

24

27

Interaction Plot

Var

iabi

lidad

de

las r

esis

tenc

ias

Temperatura-1,0 1,0

Vida=-1,0

Vida=-1,0Vida=1,0

Vida=1,0

0

10

20

30

40

Figura 11.2: Gráfico de efectos principales e interacciones del ejemplo 1

el (—) de dicho factor. La estimación será la diferencia entre el efecto medio del nivel (+) y el delnivel (—), es decir,

α =a+ ab

2− o+ b

2=1

2(−o+ a− b+ ab)

Puede observarse que la estimación es equivalente a aplicar la secuencia de signos del factor alvector de datos dividida por el número de veces que aparece el signo (+) (o el (—)). El efecto delFactor B, β, es el incremento entre el nivel (+) y el (—) de dicho factor, es decir,

β =ab+ b

2− o+ a

2=1

2(−o− a+ b+ ab) ,

donde puede comprobarse que coincide con el criterio de los signos.

Para la estimación de la interacción, puede comprobarse que su estimación es equivalente aaplicar una columna de signos obtenida multiplicando las columnas de los factores implicados. Simultiplicamos las columnas de signos del Factor A y el Factor B se obtiene:

Factor A Factor B Interacción AB Respuesta y− − + y11(o)+ − − y21(a)− + − y12(b)+ + + y22(ab)

(11.3)

y el efecto de la interacción se estima con:

[(αβ) =1

2(o− a− b+ ab) .

En resumen, el criterio de los signos sirve para:

Construir la columna de signos de las interacciones. Para ello se multiplican los signos de lascolumnas de los factores

Estimar el efecto de un factor o interacción. El efecto será:

Efecto estimado=1

node signos (+)× (producto escalar de columna de signos y datos)

Page 8: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

8 Diseño de experimentos factoriales a dos niveles

La estimación de la media global equivale a utilizar una columna con todos los signos +, esdecir:

μ =1

4(o+ a+ b+ ab).

Con los datos del Ejemplo 1 se tiene, aplicando el criterio de los signos:

Media global= 14(3 + 15 + 20 + 34) =18,

Factor A= 12(−3 + 15− 20 + 34) =13,

Factor B= 12(−3− 15 + 20 + 34) =18,

Interacción= 12(+3− 15− 20 + 34) =1,

obteniéndose los mismos resultados que antes.

11.2.3. Modelo con replicación

Si se desea contrastar si la interacción de orden más alto es significativa se ha de tener, comose vio ya en el tema anterior, replicaciones del experimento. El modelo para la variable respuestayijk, donde el subíndice k corresponde a la replicación k-ésima es:

yijk = μ+ αi + βj + (αβ)ij + uijk; i, j = 1, 2; k = 1, ...,K (11.4)

y la ecuación de regresión será:

yijk = μ+ α2DA + β2DB + (αβ)22DA ×DB + uijk

Por ejemplo, si se tiene una replicación, la tabla estándar es:

Factor A Factor B Interacción AB Respuesta y- - + y111+ - — y211- + — y121+ + + y221— — + y112+ — — y212— + — y122+ + + y222

(11.5)

Ejemplo 2:

Se repite el experimento del Ejemplo 1, obteniéndose los siguientes datos

Factor A Factor B Interacción AB Experimento 1 Experimento 2− − + y111 = 3 y112 = 2+ − — y211 = 15 y212 = 15− + — y121 = 20 y122 = 21+ + + y221 = 34 y222 = 36

La estimación del efecto de cada factor es, aplicando el criterio de los signos,

Page 9: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.2 El diseño 22 9

Media:μ= 18(+3 + 15 + 20 + 34 + 2 + 15 + 21 + 36) = 18,25

Factor A: α = 14(−3 + 15− 20 + 34− 2 + 15− 21 + 36) = 13,5 ≡ 2α2

Factor B:β = 14(−3− 15 + 20 + 34− 2− 15 + 21 + 36) = 19 ≡ 2β2

Interacción AB=cαβ = 14(+3− 15− 20 + 34 + 2− 15− 21 + 36) = 1 ≡ 2[(αβ)22

Y la ecuación de regresión es

yijk = 18,25 + 6,75DA + 9,5DB + 0,5DA ×DB + uijk.

11.2.4. Tabla ANOVA y contrastes

La tabla ANOVA se construye de la misma forma que se indicó en los temas anteriores, pues eldiseño 22 no es más que un caso sencillo de modelo con dos factores. El contraste de si un factorinfluye en la variable respuesta o la interacción es significativa se realiza con el respectivo contrasteF. En el caso del ejemplo 1 la tabla, sin contar la interacción es

y puede verse en los p-valores que si usamos un nivel de significación del 5% ambos factores influyensignificativamente en la variable respuesta. Es decir, en el contraste:

H0 : α1 = α2 = 0

H1 : H0 falsa

o bien, puesto que α1 + α2 = 0,

H0 : α2 = 0

H1 : α2 6= 0

tenemos que rechazar H0. Asímismo, en el contraste

H0 : β2 = 0

H1 : β2 6= 0

denemos tambien rechazar H0. Si se quiere contrastar si la interacción es significativa se ha deutilizar el experimento replicado del ejemplo 2. El contraste puede resumirse con las siguienteshipótesis:

H0 : (αβ)22 = 0

H1 : (αβ)22 6= 0

Page 10: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

10 Diseño de experimentos factoriales a dos niveles

La tabla ANOVA es la siguiente:

donde se confirma que los factores tienen efectos significativos y que la interacción no es significa-tiva.

11.3. El diseño 2k

En esta sección extenderemos los resultados expuestos para el diseño 22 al caso de k factorescon dos niveles cada uno. Se tiene, por tanto, 2k observaciones. Por ejemplo, si k = 3 se tienen23 =8 observaciones. La tabla estándar se construye de igual forma que en el caso 22. El primerfactor comienza con el signo (—) y alterna signos (—) y (+). El segundo factor cambia de signo cadados observaciones (21), el tercer factor cada cuatro (22) y el factor k-ésimo cada 2k-1 observaciones.Por ejemplo, el diseño 24 tiene la siguiente tabla estándar:

Factor A Factor B Factor C Factor D Respuesta y− − − − y1111 = o+ − − − y2111 = a− + − − y1211 = b+ + − − y2211 = ab− − + − y1121 = c+ − + − y2121 = ac− + + − y1221 = bc+ + + − y2221 = abc− − − + y1112 = d+ − − + y2112 = ad− + − + y1212 = bd+ + − + y2212 = abd− − + + y1122 = cd+ − + + y2122 = acd− + + + y1222 = bcd+ + + + y2222 = abcd

Las interacciones de factores tienen signos que se obtienen de multiplicar los signos de losfactores implicados. Por ejemplo, en el diseño 23 la tabla estándar con las interacciones es:

A B C AB AC BC ABC Respuesta y− − − + + + — y111 = o+ − — — — + + y211 = a− + — — + — + y121 = b+ + — + — — — y221 = ab— — + + — — + y112 = c+ — + — + — — y212 = ac— + + — — + — y122 = bc+ + + + + + + y222 = abc

Page 11: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.3 El diseño 2k 11

Asímismo, la estimación de los efectos de cada factor o interacción se realiza combinandolinealmente los datos usando la columna de signos correspondiente y dividiendo por el número designos (+) de la columna. Por ejemplo, en el diseño anterior, la estimación (βγ) del efecto de lainteracción de los factores B y C es:

d(βγ) = 1

4(+o+ a− b− ab− c− ac+ bc+ abc)

Ejemplo 3:La empresa ALCATEL ESPAÑA tiene una factoría en el municipio de Leganés donde produce,

entre otros, equipos de conmutación para telecomunicaciones. En esta planta se tiene una secciónde soldadura por ola para el ensamblaje de placas de circuitos impresos (PCB). La soldadura porola consiste en una cinta transportadora que desplaza las PCBs, que tiene todos los circuitos en-samblados pero sin soldar, sobre una cubeta rectangular que contiene estaño líquido. En la cubetaexiste un mecanismo que produce una ola en el estaño. La altura de la ola está diseñada para quetoque a la PCB quedando las conexiones de la placa soldadas.

Las inspecciones efectuadas en condiciones normales de funcionamiento señalan que el númerode soldaduras defectuosas es del 0.35% (350 ppm, donde ppm son ’partes o defectos por millón’). Sedesea realizar un experimento para determinar si existen posibilidades de mejorar su funcionamien-to. Para ello se decide controlar los siguientes factores:

Factor A: Velocidad de la cinta: 1.6/1.8 (m/min)

Factor B: Temperatura de la placa: 30/50oC

Factor C: Temperatura del estaño líquido: 210/260oC

factor D: Densidad del estaño: 0.83/0.86 (gr/cm3)

Para cada combinación de factores se utilizan 30 PCBs iguales, con 998 uniones cada una. De-spués de la soldadura se inspecciona cada placa y se contabiliza el número de defectos de soldaduraen las 30 placas. El resultado del experimento se muestra en la siguiente tabla donde

PPM =número de soldaduras defectuosas en la 30 placasnúmero de soldaduras realizadas (=30× 998) × 106.

Velocidad cinta Temp. PCB Temp. estaño Densidad PPM- - — — 299+ - — — 267- + — — 311+ + — — 299— — + — 334+ — + — 301— + + — 378+ + + — 367— — — + 334+ — — + 298— + — + 356+ + — + 321— — + + 336+ — + + 328— + + + 435+ + + + 406

Page 12: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

12 Diseño de experimentos factoriales a dos niveles

Figura 11.3: Diagrama de Pareto para los efectos del Ejemplo 3

La estimación de los efectos es (cálculos realizados con el Statgraphics 4.0)

El primer problema que se presenta al analizar un diseño 2k es saber qué factores son significa-tivos. Si no se poseen replicaciones del experimento, habrá que calcular la varianza residual s2R conla variabilidad correspondiente a las interacciones y factores no significativos. Por tanto, antes depoder hacer contrastes con la tabla ANOVA es necesario hacer una pre-selección de aquellos efectosque se consideran no significativos. Una forma secilla de decidir qué efectos excluir es mediante undiagrama de Pareto donde se representan los efectos de cada factor e interacción en valor absoluto.El diagrama de Pareto para los datos del ejemplo 3 se muestra en la figura ??.En esta figura puede verse que los efectos que más influencia tienen en la variable respuesta

son los 4 efectos principales de los factores y la interacción BC (temperatura de la placa con

Page 13: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.3 El diseño 2k 13

Figura 11.4: Grafico probabilístico normal para los datos del ejemplo 3

temperatura del estaño).

Una segunda forma de hacer la preselección es con un gráfico probabilístico normal. El fun-damento de este gráfico es el siguiente. La estimación se basa en medias muestrales, o diferenciasde medias muestrales de la variable respesta. Como estamos utilizando la hipótesis de que la vari-able respuesta es normal, las estimaciones serán combinaciones lineales de normales, lo que resultatambién en variables normales. Por tanto, si los efectos no son significativos, su valor estimadoprocederá de una distribución normal de media cero. El gráfico probabilistico normal que se usapara identificar efectos significativos se basa en esta propiedad. El gráfico probabilístico normaltiene una escala en el eje de ordendas tal que los efectos no significativos estarán alineados. Si algúnefecto es no nulo, aparecerá fuera de dicha alineación. La figura 11.4 muestra el gráfico probabilís-tico normal con los datos del ejemplo 3. De este gráfico se extraen las mismas conclusiones quedel gráfico de Pareto anterior: los factores principales y la interacción BC parecen ser los únicosefectos significativos.

A la hora de hacer una primera identificación de los efectos que pueden inclurise en el análisis,es útil tener en cuenta las dos siguiente reglas empíricas: (1) Cuanto más complejo es un efecto,es decir, cuanto más alto sea el orden de una interacción, menos probable es que tenga un efectosignificativo; (2) si dos variables no son significativas, es raro que su interacción lo sea. Con estasdos reglas empíricas y el resultado del gráfico probabilístico normal o de Pareto se hará una primeraselección de efectos. En general, esta primera selección consiste en eliminar aquellos efectos de altoorden que sean menos prometedores. Con los datos del ejemplo, en primer lugar construiremos unatabla ANOVA en la que se eliminen las interacciones de cuarto y tercer orden. La tabla que seobtiene es:

Page 14: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

14 Diseño de experimentos factoriales a dos niveles

donde se confirma que las interacciones AC, CD, AD y BD no son tampoco significativas. Sieliminamos también estas interacciones tendremos una mejor estimación de la varianza residual.La tabla ANOVA es, entonces,

Si se consideran sólo estos efectos, la ecuación de regresión es:

PPMijkl = 335,625− 12,25DA + 23,5DB + 25DC

+ 16,125DD + 12,375DB ×DC + eijkl.

Para obtener la combinación óptima de factores, se han de seleccionar los niveles que nosproporcionan los mejores valores de la variable respuesta PPM con la anterior equación. Si noexistiesen interaciones significativas, la elección de los niveles más adecuados sería muy sencilla,pues bastaría analizar la respuesta factor a factor. Si existen interacciones, no basta con observarel comportamiento individual de cada factor. Lo más sencillo es calcular el resultado de la ecuaciónde regresión para todos los experimentos y buscar la combinación más ventajosa. El resultado deesta operación con el Statgraphics es:

Page 15: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.3 El diseño 2k 15

Por lo tanto, el experimento correspondiente a la fila 2 de la tabla estándar es el que proporcionael menor número de defectos. Los mejores resultados para la instalación de soldadura por ola setendrán con:

Velocidad alta: 1.8 m/min: Factor A a nivel (+)

Temperatura de placa baja: 30oC: Factor B a nivel (—)

Temperatura de estaño líquido baja: 210oC. Factor C a nivel (—)

Densidad a nivel bajo. Factor D a nivel (—).

Con esos niveles se espera, por término medio, 271 PPM o 0.27% de defectos en lugar del0.35% que se estaban produciendo. La mejora es del 22.5%.

El procedimiento general para resolver un diseño 2k se puede resumir en los siguientes puntos:

1. Se hace un análisis previo de los datos utilizando técnicas descriptivas

2. Se estiman los efectos de los factores e interacciones

3. Se representan dichas estimaciones en un diagrama de Pareto o gráfico probabilístico normal

4. A la vista de estas representaciones gráficas se hace una preselección de los efectos que noson significativos

5. Se construye la tabla ANOVA con los efectos restantes y se contrasta su significatividad

Page 16: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

16 Diseño de experimentos factoriales a dos niveles

6. Se eliminan los efectos que, tras los contrastes anteriores, no resulten significativos y sereconstruye la tabla ANOVA hasta que todos los efectos incluidos sean significativos

7. Se hace diagnosis de los residuos para comprobar que el modelo es adecuado

8. Se construye la recta de regresión y se obtiene con ella las condiciones de los factores queproporcionan mejores valores de la variable respuesta

11.4. Fracciones

11.4.1. Conceptos generales

Se denomina fracción de un diseño factorial a un diseño en el que no se realizan todoslos experimentos que se indican en la tabla estándar, sino sólo una fracción de ellos. Veamos unejemplo a partir del diseño 23. La tabla estándar de un diseño 23 es:

A B C AB AC BC ABC Respuesta y− − − + + + — y111 = o+ − — — — + + y211 = a− + — — + — + y121 = b+ + — + — — — y221 = ab— — + + — — + y112 = c+ — + — + — — y212 = ac— + + — — + — y122 = bc+ + + + + + + y222 = abc

lo que indica que hay que realizar 8 experimentos para obtener estimaciones independientes decada efecto. Se pueden elegir muchas fracciones diferentes de este diseño. Una posible fracciónconsistiría, por ejemplo, en realizar sólo aquellos experimentos correspondientes a los signos (+)de la interacción ABC, es decir, hacer sólo la siguiente mitad de la tabla:

A B C AB AC BC ABC Respuesta y+ − — — — + + y211 = a− + — — + — + y121 = b— — + + — — + y112 = c+ + + + + + + y222 = abc

La ventaja de realizar sólo una fracción de los experimentos es clara: es más económico. Pero,como puede observarse en esta tabla, al realizarse sólo una parte de los experimentos, no se tienela información suficiente para estimar todos los efectos de forma independiente. las columnas designos ya no son todas ortogonales. Mirando las columnas de signos puede verse que el efecto de lainteracción ABC está confundido con el de la media general. Se dice entonces que ambos efectos sonalias. Igual confusión ocurre en la estimación de estos efectos. Aplicando el criterio de los signos ala tabla anterior se tiene que la estimación de la interacción ABC coincidirá con la estimación dela media μ. De la tabla se deduce que también hay confusión de los siguientes efectos:

Factor A e interacción BC

Factor B y la interacción AC

Factor C e interacción AB

Puede demostrarse que cuando estimamos efectos confundidos estamos, en realidad, estimandoel efecto agregado, o suma, de ellos. Por ejemplo, con la fracción anterior, el efecto del factor A (que

Page 17: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.4 Fracciones 17

denotamos por α) y la interacción BC (que denotamos por (βγ)) son alias. Entonces la estimaciónde estos efectos verifica que

E(α) = End(βγ)o = α+ (βγ)

Por tanto, la realización de una fracción tendrá interés sólo si suponemos que algunos de los efec-tos que se confunden son nulos. En nuestro ejemplo, la fracción propuesta es un diseño útil paraestimar los efectos principales sólo si suponemos que las interacciones de orden 2 son nulas.

Cuando la fracción consiste en realizar la mitad del diseño eligiendo signos iguales de algúnefecto se le denominamedia fracción o diseño 2k−1. Por ejemplo, la media fracción expuesta anteses una media fracción de un 23 y sería un diseño 23−1. Dado un diseño, se pueden escoger muchasfracciones distintas. Por ejemplo, otra fracción 23−1 se podría conseguir eligiendo los experimentoscorrespondientes al signo (—) de la interacción AB. La tabla sería:

A B C AB AC BC ABC Respuesta y+ − — — — + + y211 = a− + — — + — + y121 = b+ — + — + — — y212 = ac— + + — — + — y122 = bc

En este caso, la disminución del número de experimentos lleva a las siguientes confusiones:

Factor A y Factor B (sólo se diferencian en el signo: α = −β)

Factor C e interacción ABC

Interacción AB y media μ

Interacciones AC y BC

Este diseño es peor que la fracción anterior, pues confunde efectos principales entre si: no sepuede obtener una estimación independiente del factor A y el B. En resumen, una fracción de undiseño factorial

Permite economizar la investigación al necesitar menos experimentos

Confunde efectos, por lo que habrá que seleccionarlo con cautela y utilizar hipótesis simpli-ficadoras que resuelvan las confusiones

El análisis de las confusiones que se producen en una fracción se realiza mediante la llamadaecuación generatriz de la fracción. Además, estudiaremos el concepto de Resolución, quenos permitirá escoger fracciones donde no se confundan los efectos principales de los factores.

11.4.2. Ecuación generatriz de una fracción

La ecuación generatriz de una fracción permite conocer la estructura de confusión de unafracción. A esta estructura de efectos confundidos también se le conoce como estructura dealias. Denotemos con I a una columna que tiene todos sus signos (+) y a —I a una columna contodos los signos (—). La ecuación generatriz de una fracción es el conjunto de columnasde la tabla de la fracción que son iguales a I. En el caso anterior de la fracción 23−1 donde

Page 18: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

18 Diseño de experimentos factoriales a dos niveles

se escogía aquella fracción del diseño 23 que coincidía con los signos (+) de la columna ABC, laecuación generatriz es:

I = ABC.

En el segundo ejemplo, donde la fracción se escogía con los signos (—) de la columna AB, la ecuacióngeneratriz es

I = −AB.A partir de esta ecuación es fácil hallar la estructura de confusión o alias. Para ello, basta concomprobar que se cumplen las siguientes reglas para operar con columnas:

1. La multiplicación de una columna por si misma es I: AA=I; (AB)(AB)=I, etc.

2. La multiplicación de una columna por I no la modifica: AI=A; (AB)I=AB.

Aplicando estas reglas a la fracción I = ABC podemos obtener la confusión del factor A con lainteracción BC mencionada anteriormente. Si multiplicamos por A a ambos lados de la ecuacióngeneratriz se tiene:

AI = A = A(ABC) = A2BC = BC ⇒ A = BC.

Se dice entonces que el factor A y el BC están confundidos o son alias. Por tanto, si el factor Ay la interacción BC son significativas, esta fracción no podría estimar su efecto por separado. Laestimación que se obtiene sería la suma de ambos efectos. De la misma forma se puede obtener elresto de las confusiones

BI = B = B(ABC) = AB2C = AC ⇒ B = AC

CI = C = C(ABC) = ABC2 = AB ⇒ C = AB

En el segundo ejemplo, con ecuación generatriz I = −AB, se tiene la siguiente estructura de alias:

AI = A = −A(AB) = −A2B = −B ⇒ A = −B,CI = C = −C(AB) = −ABC ⇒ C = −ABC,

ABI = AB = −AB(AB) = −I ⇒ AB = −I,ACI = AC = −AC(AB) = −A2CB = −CB ⇒ AC = −CB.

11.4.3. Resolución

Uno de los fundamentos para el uso de fracciones es la hipótesis de que las interacciones deorden alto no son significativas. De esta forma, es fácil resolver las confusiones que se originan enla estimación de efectos. Este fundamento se basa en la experiencia empírica mencionada anteri-ormente: cuanto mayor es el orden de una interacción menor suele ser su efecto. Según esto, puededecirse que una fracción será buena si confunde los efectos principales de los factores con las in-teracciones de orden más alto posible. Por contra, una mala fracción será aquella que confunda losefectos principales de los factores entre sí. Estas diferencias en el tipo de confusión que se produceen una fracción se cuantifican a través del concepto de resolución, de forma que a mayor resoluciónmejor sea la fracción. Se define resolución de una fracción de la siguiente forma:

Resolución: orden de interacción más baja confundida con algún efecto principal+1.

Page 19: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.4 Fracciones 19

Por ejemplo, en una fracción de resolución III, los efectos principales pueden estar confundidoscon interacciones de orden 2, pero no hay confusión de efectos principales entre si. Por ejemplola fracción 23−1 construida con la ecuación I = ABC es de resolución III. Esta fracción tambiénpuede escribirse como 23−1III . En el caso de la fracción de ecuación I = −AB la resolución es II(23−1II ) pues los efectos principales están confundidos entre si. En estos dos ejemplos puede verseque una definición alternativa de resolución es el número de letras de la ecuación generatriz (si laecuación consta de varias palabras, la resolución está determinada por la más corta).

Supongamos que queremos un diseño 2k−1 con máxima resolución. Un procedimientro generalpara conseguirlo es el siguiente:

1. Escribir el diseño factorial completo para k-1 variables. Por ejemplo, si queremos un diseño23−1 comenzaríamos escribiendo la tabla de un diseño 22.

2. Asignamos la variable k-ésima a alguna columna de interacción de orden k-1. En el casodel diseño 23−1, el tercer factor sería asignado a la columna de signos de los dos factoresprincipales del 22

En general, diseños 2k−p con máxima resolución se obtienen de la siguiente forma:

1. Se escribe el diseño completo para k-p factores

2. Se asignan los p factores adicionales a las columnas de las interacciones de mayor ordenposible

Ejemplo 4:Se desea realizar un diseño para determinar la significatividad de 6 factores (A,B,C,D,E,F)

sobre una variable respuesta. Debido al coste de la recogida de datos, se desea hacer un primeranálisis con sólo 8 experimentos. ¿Cómo ha de ser el diseño?Si se van a recoger sólo 8 datos se ha de partir de la tabla de un diseño 2 3 :

A B C AB AC BC ABC− − − + + + —+ − — — — + +− + — — + — ++ + — + — — —— — + + — — ++ — + — + — —— + + — — + —+ + + + + + +

Para asignar los factores D, E y F hay varias opciones, o asignarlos en las columnas de lasinteracciones de orden 2 o asignar un factor en la columna ABC y los otros dos factores en lascolumnas de interacción de orden 2. En el caso en que se asignen a las columnas de orden dos, eldiseño final sería

A B C D=AB E=AC F=BC− − − + + ++ − — — — +− + — — + —+ + — + — —— — + + — —+ — + — + —— + + — — ++ + + + + +

Page 20: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

20 Diseño de experimentos factoriales a dos niveles

y el diseño es de resolución III al confundirse los efectos principales con las interacciones deorden 2. Este diseño puede entonces escribirse como 2 6−3III . Utilizando que D=AB se obtiene queDD=I=ABD. Operando de esta forma se obtiene la siguiente ecuación generatriz:

I = ABD = ACE = BCF.

Esta ecuación puede ampliarse incorportando términos de orden 4 ó superior, aunque en la prácticasuelen tener escaso interés. Aplicando que ABD=ACE, entonces ABDACE=BDCE=I. Análoga-mente se tiene que (ABD)(BCF)=ACDF=I y también que (ACE)(BCF)=ABEF=I. Multiplicandolos términos de tres en tres se tiene que (ABD)(ACE)(BCF)=DEF. La ecuación generatriz com-pleta es

I = ABD = ACE = BCF = DEF = BDCE = ACDF = ABEF.

La estructura de alias de los efectos principales es:

A = BD = CE = ABCF

B = AD = ABCE = CF

C = ABDF = AE = DF

D = AB = ACDE = BCDF

E = ABDE = AC = BCFE

F = ABDF = ACEF = BC

La segunda opción para diseñar la fracción consiste en asignar uno de los factores a la interac-ción ABC. Si hubiese algún motivo para pensar que alguna interacción de orden 2 fuese significativapodría dejarse dicha columna libre y utilizar el resto de las columnas de interacciones para asignarlos factores restantes. Por ejemplo, si se sospechase que la interacción AB pudiese ser significativa,un diseño que no confundiese la interacción AB con ningún factor principal sería

A B C D=AC E=BC F=ABC− − − + + —+ − — — + +− + — + — ++ + — — — —— — + — — ++ — + + — —— + + — + —+ + + + + +

que seguiría siendo de resolución III. Su ecuación generatriz es:

I = ACD = BCE = ABCF.

De esta ecuación se obtiene la siguiente estructura de alias de los efectos principales:

A = CD = ABCE = BCF

B = ABCD = CE = ACF

C = AD = BE = ABF

D = AC = BCDE = ABCDF

E = ACDE = BC = ABCEF

F = ACDF = BCEF = ABC

Page 21: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.4 Fracciones 21

donde se comprueba que los efectos principales se confunden con interacciones de orden 2, exceptocon la interacción AB, que se espera sea significativa, por lo que los efectos de interés pueden serestimados adecuadamente.

Si resolvemos este problema con el Statgraphics 4.0, utilizará por defecto el primero de los dis-eños. Es decir, asignaría los factores adicionales a los efectos de orden 2. Si quisiesemos planear lasegunda opción deberíamos usar la opción ’user specified design’. Al decir al programa que deseamosun diseño con 6 factores nos proporciona las siguientes opciones:

Si estamos interesados en un diseño de 8 experimentos seleccionaremos el diseño 2 6−3III . El orde-nador proporciona la siguiente estructura de alias completa:

Estructura de alias. Salida del Statgraphics 4.0

11.4.4. Ampliación de los diseños: diseños secuenciales

El análisis de una fracción se realiza de la misma forma que los diseños completos. La tablaANOVA nos dirá qué efectos son significativos. Para resolver las confusiones se ha de emplear lainformación adicional que se tenga sobre la posible significatividad de las interacciones. En caso deduda se debe ampliar el experimento de forma que la interacción de interés no tenga confusiones.

Page 22: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

22 Diseño de experimentos factoriales a dos niveles

En general se cumplen las siguientes reglas

Es infrecuente que si dos factores no son significativos lo sean las interacciones

Los efectos principales suelen ser de mayor magnitud que las interacciones

Hay situaciones en las que pueden existir dudas. Veamos, por ejemplo, el diseño 26−3III queproporciona el Statgraphics para el ejemplo anterior. Supongamos que tras analizar los datos sedetecta que los contrastes 1,2 y 4 son significativos (ver figura ??). En ese caso existen variasinterpretaciones (suponiendo que las interacciones de orden 3 o mayores no son significativas)

Los factores A,B y D son significativos y no hay interacciones significativas

Los factores A, B y su interacción AB son significativos. El factor D no es significativo nininguna otra interacción

Los factores A y D y su interacción AD son los efectos significativos. El factor B no essignificativo ni ninguna otra interacción

Los factores B y D y su interacción BD son los efectos significativos. El factor A no essignificativo ni ninguna otra interacción

Si no se posee información adicional para decidir cuál de estas cuatro opciones es la másadecuada se debe ampliar el experimento. En este caso, el segundo diseño se trataría sólamentede un diseño con 3 factores A, B, y D donde la interacción de tercer orden y las interaccionesAD y BD no serían significativas. Por tanto, una opción económica es realizar un diseño 23 dondeutilizaríamos las interacciones no significaticas para calcular la VNE y poder hacer contrastes.De esta forma, con un total de 8+8=16 experimentos habríamos resuelto el análisis, en lugarde los 26 = 64 experimentos que requeriría un diseño factorial completo. Esta forma de resolverel problema: la aplicación secuencial de diseños con el mínimo número de experimentosposible, es la clave del diseño de experimentos en ingeniería.

Para el problema del ejemplo 4 se opta por el siguiente diseño 2 6−3III :

A B C D=AB E=AC F=BC− − − + + ++ − — — — +− + — — + —+ + — + — —— — + + — —+ — + — + —— + + — — ++ + + + + +

Después de realizarse los 8 experimentos se obtienen los siguientes datos

A B C D E F Respuesta− − − + + + 3+ − — — — + 15− + — — + — 20+ + — + — — 34— — + + — — 3+ — + — + — 15— + + — — + 19+ + + + + + 36

Page 23: Capítulo 11 - Departamento de Estadí · PDF fileEste es el caso más sencillo de diseños factoriales a dos ... El diseño consta de dos factores: ... de signo cada dos experimentos

11.4 Fracciones 23

Figura 11.5:

La estimación de los parámetros (utilizando el criterio de los signos) proporciona las estima-ciones que están representadas en el siguiente diagrama de pareto (valores absolutos).Este gráfico sugiere que los factores E, F, C y sus interacciones son no significativos. De es-

ta forma, sus grados de libertad se utilizan para estimar la varianza residual. La tabla ANOVAresultante de no considerar estos efectos es

El resultado no es claro, pues no se sabe si los factores A, B y D son los efectos significativos osólo lo son dos de ellos y su interacción. El paso siguiente sería proponer un segundo experimentocon sólo estos 3 factores.