DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca...

27
1 Diseño de Experimentos Diseños factoriales 2 k Licenciatura en Estadística 2015 Dr. José Alberto Pagura Lic. Lucía N. Hernández Dra. Daniela F. Dianda Diseños 2 k Una clase especial de diseños factoriales equilibrados, lo constituyen los diseños conocidos como 2 k En ellos, se ensayan k factores, cada uno a dos niveles Su nombre se deriva de la cantidad de tratamientos ensayados o de experimentos elementales que se realizan. Una réplica completa comprende 2x2x...x2 (kveces) observaciones. Si el experimento es sin replicación, 2 k será el total de pruebas.

Transcript of DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca...

Page 1: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

1

Diseño de Experimentos

Diseños factoriales 2k

Licenciatura en Estadística

2015

Dr. José Alberto Pagura

Lic. Lucía N. Hernández

Dra. Daniela F. Dianda

Diseños 2k

• Una clase especial de diseños factoriales

equilibrados, lo constituyen los diseños conocidos

como 2k

• En ellos, se ensayan k factores, cada uno a dos

niveles

• Su nombre se deriva de la cantidad de tratamientos

ensayados o de experimentos elementales que se

realizan.

• Una réplica completa comprende 2x2x...x2 (kveces)

observaciones.

• Si el experimento es sin replicación, 2k será el total

de pruebas.

Page 2: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

2

Diseños 2k

• Particularmente útil en las primeras fases del trabajo

experimental, cuando posiblemente haya muchos

factores que investigar.

• Es el diseño factorial completo con menor número de

tratamientos para estudiar los efectos de k factores

• Se debe suponer que la respuesta es

aproximadamente lineal en el espacio experimental

elegido (se consideran 2 niveles para cada factor)

Diseños 2k

Los métodos de análisis que se

estudiarán consideran que los efectos

son fijos, que los diseños son

completamente aleatorizados y que se

satisface el supuesto usual de

normalidad

Page 3: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

3

Diseños 2k

• Los análisis estadísticos se hacen a partir

de la descomposición de la Sctotal en una

serie de términos asociados a cada

efecto investigado (todos ortogonales) +

un término debido al error que recoge

todo efecto de factores no controlados

Notación

• Los efectos se indican con letras latinas

mayúsculas, A es el efecto de ese factor,

AB es el efecto de la interacción entre

ambos factores

• Los niveles de cada factores se designan

como inferior y superior y se representan

con – y +

Page 4: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

4

Notación

• Los tratamientos se representan con

* (1)Aquel que tiene todos los factores a nivel –

* Con letras latinas minúsculas para los factores

a nivel + y ninguna letra para los que están a

nivel -. Si se tienen 5 factores, el tratamiento

acd es la combinación de A, C y D a nivel +

y B, E a nivel -

Efectos que pueden estimarse

• En un diseño 2k es posible descomponer la

SCtotal en 2k-1 efectos, c/u con 1 grado de

libertad:

• K efectos simples

• (K en 2) interacciones dobles

• (k en 3) interacciones triples

• ........

• (k en k)=1 interacción de orden k

• En la práctica, es difícil tener interés en estudiar

interacciones de orden superior a dos

Page 5: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

5

Ortogonalidad

• Dos efectos principales son ortogonales si

en las pruebas del diseño experimental, en

cada una de las variantes de un factor,

aparecen en idénticas proporciones las

variantes del otro.

• Inmediatamente se puede extender la

definición, a otros efectos.

• En los diseños factoriales equilibrados,

todos los efectos son ortogonales.

El caso más sencillo: diseño 22

• Se desea estudiar el efecto del uso de

nitrógeno y la profundidad de labranza,

sobre el rendimiento de azúcar en kg/ha en

remolachas.

• Nitrógeno: sin y 336,33 kg./ha de sulfato

de amonio

• Profundidad: 18 y 28 cms.

Page 6: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

6

Resultados profundidad nitrógeno tratamientos

rendimiento

promedio

18 n0 (1) - - 4,54 4,64 4,59

28 n0 a + - 4,77 4,73 4,75

18 n1 b - + 5,32 5,4 5,36

28 n1 ab + + 5,59 5,67 5,63

niveles

codificados

réplica

1 2

1

-1

1-1

dosis de nitrogeno

profundidad

5,63

4,754,59

5,36

Gráfica de cubos (medias de los datos) para rendimiento

Efectos y coeficientes estimados para rendimiento

(unidades codificadas)

Término Efecto

profundidad 0,21500

dosis de nitrogeno 0,82500

profundidad*dosis de nitrogeno 0,05500

Estimación de los efectos

• Asocie el cálculo de las estimaciones de

los efectos, a la representación gráfica de

los ensayos en un cuadrado.

• Asocie el cálculo de los efectos, a los

signos que representan los niveles de los

factores

Page 7: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

7

Análisis de los resultados

1-1

5,75

5,50

5,25

5,00

4,75

4,50

dosis de nitrogenoM

ed

ia

-1

1

profundidad

Gráfica de interacción para rendimientoMedias de datos

1-1

5,5

5,4

5,3

5,2

5,1

5,0

4,9

4,8

4,7

4,6

1-1

profundidad

Me

dia

dosis de nitrogeno

Gráfica de efectos principales para rendimientoMedias de datos

Análisis de los resultados

Fuente GL SC CM F P

profundidad 1 0,09245 0,09245 30,31 0,005

dosis de nitrogeno 1 1,36125 1,36125 446,31 0,000

Interacción 1 0,00605 0,00605 1,98 0,232

Error 4 0,01220 0,00305

Total 7 1,47195

0,100,050,00-0,05-0,10

99

95

90

80

70

60

50

40

30

20

10

5

1

Residuo

Po

rce

nta

je

Gráfica de probabilidad normal(la respuesta es rendimiento)

5,755,505,255,004,754,50

0,050

0,025

0,000

-0,025

-0,050

Valor ajustado

Re

sid

uo

vs. ajustes(la respuesta es rendimiento)

Page 8: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

8

Análisis de los resultados

Efectos y coeficientes estimados para rendimiento (unidades codificadas)

Término Efecto Coef SE Coef T P

Constante 5,08250 0,01953 260,30 0,000

profundidad 0,21500 0,10750 0,01953 5,51 0,005

dosis de nitrogeno 0,82500 0,41250 0,01953 21,13 0,000

profundidad*dosis de nitrogeno 0,05500 0,02750 0,01953 1,41 0,232

¿Cuantas pruebas se hubiesen necesitado estudiando de un factor

por vez, para estimar los efectos con la misma precisión que en

el diseño factorial?

con esa estrategia: ¿se hubiese podido determinar la

significación estadística de la interacción o estimar su efecto?

Respuesta media esperada • La respuesta para condiciones definidas

por alguno de los tratamientos

experimentados, se estimará con la

respuesta media obtenida para ese

tratamiento.

• Se completará dicha estimación puntual,

con una estimación por intervalo de

acuerdo al procedimiento que se presenta

más adelante

Page 9: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

9

Diseño 23

• Se busca estudiar efectos de 3 factores

sobre una variable respuesta, considerando

dos niveles o variantes para cada factor.

Diseño: Variedad de “tratamientos”

Prueba Factor

A

Factor

B

Factor

C

1 - - -

2 + - -

3 - + -

4 + + -

5 - - +

6 + - +

7 - + +

8 + + +

C está a nivel –

A está 2 veces –

2 veces +

B está 2 veces –

2 veces +

C está a nivel +

A está 2 veces –

2 veces +

B está 2 veces –

2 veces +

Page 10: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

10

Efectos principales

• El efecto promedio de un factor se define

como el cambio en la respuesta producido

por el cambio en el nivel de ese factor,

promediado sobre los niveles del otro

factor

Estimación de un efecto principal

• El efecto producido por un factor (C) se

puede cuantificar mediante la diferencia

del nivel medio de la variable respuesta

cuando A está a nivel + y el nivel medio de

la misma cuando A está a nivel -

• El número entre paréntesis indica el valor

medio de la respuesta para ese número de

prueba, para la matriz del diseño en orden

estándar.

(5) (6) (7) (8) (1) (2) (3) (4)

4 4C

Page 11: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

11

Estimación de la interacción

• Se dice que hay interacción entre dos

factores cuando el efecto de uno de ellos es

diferente, según el nivel al que está el otro

• ¿Cómo se puede cuantificar la interacción?

• Pensemos en la interacción entre B y C

• El efecto de B cuando C está a nivel + y

cuando está C a nivel - es:

(7) (8) (5) (6)/

2 2B C

(3) (4) (1) (2)

/2 2

B C

Efecto interacción • Se define el efecto interacción BxC a la mitad

de la diferencia entre: el efecto de B cuando C

está a nivel + y el efecto de B cuando C está a

nivel –, es decir:

• Daría lo mismo haber definido la interacción

tomando los efectos de C con B+ y B-

• Si observamos, cada efecto estimado es un

contraste: promedio ponderado con

ponderaciones que suman cero

1( / / )

2BxC B C B C

Page 12: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

12

Signos de los contrastes • La forma de definir el diseño denominando a

los niveles de cada factor con (+) y (-), hace

más fácil e intuitiva la “aritmética” para

calcular los efectos y comprobar su

ortogonalidad

• Los signos de los niveles de los factores,

definen los contrastes que permiten estimar

cada efecto, ya sea uno principal o una

interacción

• ¿Cómo están definidos los de la interacción?

Ejemplo de un diseño factorial 23

En una planta piloto, se investigó el efecto de

temperatura(T), concentración(C) y

catalizador(K) sobre la producción en

gramos (Box, Hunter y Hunter, pág. 318)

Una tabla con la combinación de niveles a

experimentar como la que sigue se conoce

como matriz de diseño

Page 13: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

13

Notaciones para la matriz de

diseño Experimento T C K T C K

1 - - - 1 0 0 0

2 + - - t 1 0 0

3 - + - c 0 1 0

4 + + - tc 1 1 0

5 - - + k 0 0 1

6 + - + tk 1 0 1

7 - + + ck 0 1 1

8 + + + tck 1 1 1

Los datos

Temperatura Concentración Catalizador Producción

T C K y

- - - 60

+ - - 72

- + - 54

+ + - 68

- - + 52

+ - + 83

- + + 45

+ + + 80

Temperatura Concentración Catalizador

- 160 - 20 - A

+ 180 + 40 + B

Page 14: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

14

Cálculo de los Efectos

• ¿Efectos principales?

Temperatura

Concentración

Catalizador

• ¿Interacciones?

Temperatura*Concentración

Temperatura*Catalizador

Concentración*Catalizador

Temperatura*Concentración*Catalizador

Cálculo de efectos principales

Representación geométrica

Page 15: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

15

Cálculo de interacciones dobles

Representación geométrica

Cálculo de interacciones triples

Representación geométrica

Page 16: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

16

Más sobre el cálculo de los

efectos

• Otro método utilizado para el cálculo de

los efectos es el algoritmo de Yates

• Este se aplica a las observaciones puestas

en orden estándar

• En el diseño 23 se construyen tres

columnas adicionales cuyos valores se

calculan como sigue:

Algoritmo de Yates para un diseño 23

Primera columna

• Columna (1):

Sus valores se obtienen a partir de las respuestas “y”

Los primeros cuatro números se obtienen sumando los cuatro pares

Los segundos cuatro números se obtienen restando el número de arriba del de debajo de cada pareja.

Page 17: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

17

Algoritmo de Yates para un diseño 23

Segunda y Tercera columna

• Columna (2): sus valores se obtienen a

partir de la columna (1) y el procedimiento

para calcular cada valor es el mismo que se

definió para la columna (1) pero en lugar

de hacer a partir de los valores de “y” se

hace a partir de los de (1)

• Columna (3): de la misma manera que las

columnas anteriores pero a partir de (2)

Algoritmo de Yates para un diseño 23

Cálculo de los efectos

• Los efectos se obtienen dividiendo los valores

de la columna (3) por los denominadores

adecuados: 8 para la primera fila (media

general) y 4 para las siguientes.

• En el caso del diseño 2k, habrá k columnas

que se generarán sumando y restando

adecuadamente parejas de números. El primer

divisor será 2k y los restantes 2k-1

Page 18: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

18

Algoritmo de Yates. Cálculos en el

ejemplo

Tratamiento y (1) (2) (3) Divisor Estimación

del efecto

Identificación

1 60 132 254 514 8 64.25 Media

2 72 122 260 92 4 23.0 T

3 54 135 26 -20 4 -5.0 C

4 68 125 66 6 4 1.5 TC

5 52 12 -10 6 4 1.5 K

6 83 14 -10 40 4 10.0 TK

7 45 31 2 0 4 0.0 CK

8 80 35 4 2 4 0.5 TCK

Sumas de cuadrados

• Un efecto es un contraste de la forma

Dividido por (k-1) donde ci son los coeficientes que

en este caso serán iguales a 1 o –1 y:

La suma de cuadrados de un contraste en el caso

balanceado es:

con un solo grado de libertad

2

.

1

k

i i

i

C c y

22

.

1

22

1

k

k

i i

i

c

i

i

c y

SC

n c

2

1

0

k

i

i

c

Page 19: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

19

Sumas de cuadrados

• Teniendo en cuenta que el conjunto de 2k-1

contrastes ortogonales descomponen la

suma de cuadrados debida a los

tratamientos en esa misma cantidad de

componentes independientes, la diferencia

de la suma de cuadrados total y la suma de

las SCc será la SCresidual

Sumas de Cuadrados

• La SC de un efecto, principal o

interacción, se puede escribir como:

• SCefecto = (nº de datos/4) Efecto2

• Recordar que el efecto siempre es la

diferencia de dos promedios: el de las

pruebas asociadas a signos + y el de las

pruebas asociadas a signos –

Page 20: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

20

Más sobre el ejemplo

• Un detalle omitido hasta aquí, es que los

ocho valores de producción son en realidad

la media de dos experimentos elementales

replicados. Esto permite el cálculo de las

variancias para completar un análisis de los

datos.

Estimaciones de los efectos

Term Effect Coef SE Coef T P

Constant 64,250 0,7071 90,86 0,000

T 23,000 11,500 0,7071 16,26 0,000

C -5,000 -2,500 0,7071 -3,54 0,008

K 1,500 0,750 0,7071 1,06 0,320

T*C 1,500 0,750 0,7071 1,06 0,320

T*K 10,000 5,000 0,7071 7,07 0,000

C*K 0,000 0,000 0,7071 0,00 1,000

T*C*K 0,500 0,250 0,7071 0,35 0,733

Page 21: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

21

Condición óptima

• La condición óptima será

• Temperatura a nivel +

• Concentración a nivel –

• Catalizador ¿a que nivel?

Predicción de la respuesta en

condiciones óptimas halladas

Media del experimento 64,25

Efecto de T+ (23/2) 11,50

Efecto de C- (5/2) 2,50

Efecto de K+ (1,5/2) 0,75

Efecto de (TK)+ (10/2) 5,00

Producción media prevista 84,00

Page 22: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

22

Intervalo de confianza para la

predicción media

• Un intervalo del 95% confianza para la media se puede calcular como:

CMerror resulta igual a 6,73 y el IC para la predicción es:

84 ± t11;0,95 *((6,73/16)*(1+4))1/2

84 ±2,2001*1,45 ; 84 ± 3,19

1,1Pr 1 2residualgl

CMedicción t gl

N

Tabla ANOVA

Source DF Seq SS Adj SS Adj MS F P

T 1 2116,00 2116,00 2116,00 314,54 0,000

C 1 100,00 100,00 100,00 14,86 0,003

K 1 9,00 9,00 9,00 1,34 0,272

T*K 1 400,00 400,00 400,00 59,46 0,000

Error 11 74,00 74,00 6,73

Total 15 2699,00

Page 23: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

23

Experimentos sin replicación

• En los experimentos 2k sin réplicas, si se quieren

probar TODOS los efectos, no quedan grados de

libertad para el error. Por lo tanto, se suelen desechar

de entrada las interacciones de orden elevado

(probablemente no significativas) que serán

“confundidas” con el error

• Siempre se aconseja que para hacer un ANOVA los

grados de libertad del error no sean tan pequeños, para

tener suficiente potencia (no menor que 4). Alrededor

de 10 sería recomendable

Experimentos con muchos factores • Cuando no hay suficientes grados de libertad,

por haber muy pocas pruebas o porque se

quieren probar varias interacciones, se puede

usar un método gráfico

• Si no hubiera efectos reales significativos, los

efectos diferirían de cero sólo por azar, con

variabilidad igual a 2/N

• Por lo tanto los efectos deberían estar sobre una

recta en un gráfico sobre papel normal

Page 24: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

24

Gráfico de Daniel

• Ese gráfico es conocido como “gráfico de

Daniel” y permitirá visualizar aquellos

efectos no significativos, los que “unirán”

al error en el ANOVA permitiendo test con

mayor potencia

Plot de Daniel para el ejemplo

Standardized Effect

Pe

rce

nt

151050-5

99

95

90

80

70

60

50

40

30

20

10

5

1

A T

B C

C K

Factor Name

Not Significant

Significant

Effect Type

AC

B

A

Normal Probability Plot of the Standardized Effects(response is y, Alpha = ,05)

Page 25: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

25

Bloques en diseño factorial 2k

• Se va a realizar un experimento 23.

• El material experimental es un compuesto y es deseable que se mezclen las materias primas (que pueden provenir de diferentes proveedores, diferentes lotes, etc.)

• Sin embargo, no se puede conseguir material homogéneo más que para cuatro experimentos.

Bloques en diseño factorial 2k

• El diseño 23 puede dividirse en bloques

como se indica:

7

3 4

8

2

5 6

1

Factores

2 3

1

Page 26: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

26

Bloques en diseño factorial 2k

• Los tratamientos 1,4,6 y 7 se probaron con

el compuesto 1

• Los tratamientos 2, 3, 5 y 8 se probaron

con el compuesto 2

• Si hay efecto aditivo de los compuestos,

quedará cancelado al calcular los efectos

principales y las interacciones dobles

Confusión

• Observar que se ha confundido

deliberadamente la interacción triple con el

efecto de los compuestos

• A cambio, los efectos principales y las

interacciones dobles se pueden medir con

mayor precisión que si no se hubiesen

utilizado bloques.

Page 27: DISEÑO DE EXPERIMENTOS - fcecon.unr.edu.ar · el diseño factorial? ... Diseño 23 •Se busca estudiar efectos de 3 factores sobre una variable respuesta, considerando dos niveles

27

Confusión

• En este ejemplo, puede pensarse que la variable

bloque es un cuarto factor que llamamos 4.

• Este factor tiene la particularidad de no

interactuar con los demás factores

• Si la asignación de los niveles del factor 4 a los

tratamientos se definió en base a hacer coincidir

los signos + y – con los de la interacción se puede

decir que el bloque está “generado” por la

relación 4=123

Cómo construir esquemas más

complejos

• La idea expuesta nos permitirá derivar esquemas

de bloques más complejos.

• En esos casos deberá ponerse cuidado cuidado

especial en la definición de modo que las

variables de bloques no se confundan con

interacciones que podrían ser significativas y lo

mismo con las posibles interacciones entre

variables de bloqueo.