Experimentos Factoriales Completo

32
EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007 EXPERIMENTOS FACTORIALES COMPLETOS Página 1 de 32

description

Estadística

Transcript of Experimentos Factoriales Completo

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

EXPERIMENTOS FACTORIALES COMPLETOS

Página 1 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

CONTENIDO

1. Diseño factorial de dos factores

2. Diseño factorial de dos factores

3. Comparaciones múltiples

Página 2 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

1. Diseño factorial completo de 2 factores Ul ingeniero decide probar los tres materiales de la cubierta, único

factor controlable a tres niveles de temperatura (15, 70 y 125 °F)

consistentes en el entorno de uso final del producto. Se prueban

cuatro baterías a cada combinación de material de la cubierta y

temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de

duración observada de las baterías.

En este problema, el ingeniero desea contestar las siguientes

preguntas:

1. ¿Qué efecto tienen el tipo de material y la temperatura sobre la

duración de la batería?

2. ¿Existe una elección del material que dé por resultado una

duración uniformemente larga sin importar la temperatura?

Tipo de

material

Temperatura F

15 70 125

1 13

0

15

5

34 40 2

0

70

74 18

0

80 75 8

2

58

3 15

0

18

8

12

6

12

2

2

5

70

15

9

12

6

10

6

11

5

5

8

45

3 13

8

11

0

17

4

12

0

9

6

10

4

16

8

16

0

15

0

13

9

8

2

60

Página 3 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Tabla 1. Duración en horas para el ejemplo del diseño de una batería

Esta última pregunta reviste particular importancia. Existe la

posibilidad de hallar un material que no sea muy afectado por la

temperatura. De ser así, el ingeniero puede hacer que la batería sea

robusta a la variación de temperatura en el campo. Éste es un

ejemplo del uso del diseño experimental estadístico para el diseño de

un producto robusto (o consistente), un importante problema de

ingeniería.

Este diseño es un ejemplo específico del caso general de un diseño

con dos factores (bifactorial). Para pasar al caso general, sea Yijk la

respuesta observada cuando el factor A se encuentra en el i-ésimo

nivel (i -1, 2,..., n). En general, los datos observados se verán como en

la tabla 2. El orden en el cual se toman las abn observaciones es

aleatorio, de modo que éste es un diseño completamente

aleatorizado.

Tabla 2. Disposición general para un diseño bifactorial

Las observaciones pueden describirse mediante el modelo estadístico

lineal:

Página 4 de 27

Y111,Y112,...,Y11n

Factor A

Factor B

Y211,Y212,...,Y21n

...

Ya11,Ya12,...,Ya1n

... ... ...

Y121,Y122,...,Y12n

...Y1b1,Y1b2,

...,Y1bn

Y221,Y222,...,Y22n

...

...

Y2b1,Y2b2,...,Y2bn

Ya21,Ya22,...,Ya2n

Yab1,Yab2,...,Yabn

1 2 ... b

1

2

...

a

Y111,Y112,...,Y11n

Factor A

Factor B

Y211,Y212,...,Y21n

...

Ya11,Ya12,...,Ya1n

... ... ...

Y121,Y122,...,Y12n

...Y1b1,Y1b2,

...,Y1bn

Y221,Y222,...,Y22n

...

...

Y2b1,Y2b2,...,Y2bn

Ya21,Ya22,...,Ya2n

Yab1,Yab2,...,Yabn

1 2 ... b

1

2

...

a

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

En donde es el efecto medio general, i es el efecto del i-ésimo nivel

del factor renglón A, j es el efecto del j-ésimo nivel del factor

columna B, ()ij es el efecto de la interacción entre i y j, ijk es el

componente del error aleatorio. Inicialmente se supone que ambos

factores son fijos y que los efectos de tratamiento se definen como

desviaciones de la media general, por lo tanto. Se

supone que los efectos de interacción son fijos y que se definen dé

manera que: . Hay un total de abn observaciones porque

se realizan n réplicas.

En un diseño factorial de dos factores, tanto los factores (o

tratamientos) de renglón como de columna tienen la misma

importancia, específicamente el interés consiste en probar hipótesis

acerca de la igualdad de los efectos de tratamiento de renglón, es

decir:

Y de la igualdad de los efectos de tratamiento de columna:

También es interesante determinar sí los tratamientos de renglón y

columna interaccionan. En otras palabras, resulta conveniente

probar:

A continuación, se muestra cómo pueden probarse estas hipótesis

usando un análisis de variancia bifactorial o bidireccional (de dos

factores o en dos sentidos).

Página 5 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Análisis Estadístico del Modelo de Efectos Fijos

ea Yi..; el total de las observaciones bajo el i-ésimo nivel del

factor A; Y.j. El total de las observaciones bajo el j-ésimo nivel

del factor B, Yij. El total de las observaciones de la ij-ésima celda, e

Y... el total general de todas las observaciones. Se definen

como los promedios de renglón, columna, celda y

general, respectivamente, matemáticamente:

S

La suma total de cuadrados corregida puede expresarse mediante:

Porque los seis productos cruzados del segundo miembro de la

ecuación anterior son iguales a cero. Se observa que la suma total de

cuadrados se ha descompuesto en una suma de cuadrados debida a

los “renglones” o al “factor” A (SSA) en una suma de cuadrados

debida a las "columnas" o al factor B (SSB), en una suma de

cuadrados debida a la interacción entre A y B (SSAB), y en una suma

de cuadrados debida al error (SSE): Analizando el último término del

miembro derecho de la Ecuación anterior es posible observar que es

necesario tener al menos dos réplicas (n 2) para poder obtenerla

suma de cuadrados del error.

Simbólicamente, la Ecuación anterior puede expresarse mediante:

Página 6 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Los grados de libertad asociados a cada suma de cuadrados son:

Página 7 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Efecto Grados de

libertad

A a-1

B b-1

Interacción

AB

(a-1)(b-1)

Error ab(n-1)

Total abn-1

Esta descomposición del total de abn -1 grados de libertad para las

sumas de cuadrados se puede justificar como sigue: Los efectos

principales de A y B tienen a y b niveles, respectivamente, por lo

tanto, tienen a -1 y b -1 grados de libertad como se muestra.

Los grados de libertad de la interacción simplemente corresponden a

los grados de libertad de cada celda (los cuales son iguales a ab -1)

menos los grados de libertad de los dos efectos principales A y B en

otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de

las ab celdas hay n -1 grados de libertad entre las n réplicas, por lo

tanto, hay ab(n -1) grados de libertad del error.

Se observa que la suma de los grados de libertad de los términos del

miembro derecho de la ecuación anterior es igual al total de los

grados de libertad.

Cada suma de cuadrados dividida entre sus grados de libertad

produce una media de cuadrados. Los valores esperados de las

medias de cuadrados son:

Página 8 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Hay que notar, que si las hipótesis nulas, las cuales consisten en

proponer que no hay efectos de tratamiento de renglón, columna e

interacción, son verdaderas, entonces MSA, MSB, MSAB y MSE son

estimadores de 2. Sin embargo, si por ejemplo existen diferencias

entre los tratamientos de renglón, entonces MSA será mayor que MSE.

En forma similar, si hay efectos de tratamiento de columna o

interacción, las medias de cuadrados correspondientes serán

mayores que MSE.

Por lo tanto, para probar el significado de ambos efectos principales,

así como de su interacción, simplemente deben dividirse las medias

de cuadrados correspondientes entre la media de cuadrados del

error. Valores grandes de estas razones implican que los datos no

concuerdan con las hipótesis nulas.

Si se considera que el modelo estadístico es adecuado y que los

términos del error ijk son independientes con distribuciones

normales con variancia constante 2, entonces las razones de las

medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen

distribución F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el

numerador, respectivamente, y ab(n -1) grados de libertad en el

denominador. Las regiones críticas corresponden al extremo superior

de la distribución F. Usualmente la prueba se presenta en una tabla

de análisis de variancia como la que aparece en la tabla 2.

Página 9 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Fuente de

Variación SS G.L. MS FoTratamientos A

SSA a - 1

Tratamientos B

SSB b - 1

Interacción SSA

B

(a - 1)(b - 1)

Error SSE ab(n-1)

Total SST abn - 1

Tabla 2 ANOVA para el modelo bifactorial de efectos fijos

Es posible obtener las fórmulas para calcular las sumas de cuadrados

de la ecuación anterior. La suma total de cuadrados se calcula en

forma usual mediante:

Las sumas de cuadrados para los efectos principales son:

Es conveniente obtener SSAB en dos etapas. Primero se calcula la

suma de cuadrados entre los totales de las ab celdas, conocida como

la suma de cuadrados debido a los "subtotales":

Página 10 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la

segunda etapa consiste en calcular SSAB mediante:

La SSE se calcula por diferencia:

Página 11 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Ejemplo: Más sobre el experimento de diseño de una batería. En la

tabla 3 se presenta la duración efectiva (en horas) observada en el

ejemplo de diseño de una batería descrito en la anterior Los totales

de renglón y de columna se indican en los márgenes de la tabla; los

números subrayados son los totales de celda.

Tipo de

Mat.

Temperatura (F)

15 70 125 Yi..

1 130

155

34 40229

20

70230

99874 18

080 75 8

258

2 150

188

623

136

122 47

9

25

70198

130015

9126

106

115

58

45

3 138

110

576

174

120 58

3

96

104 34

2150116

8160

150

139

82

60

Y.j.=

1738 1291 770 Y...=

3799

Tabla 3. Duración (en horas) para el experimento de diseño de una

batería

Las sumas de cuadrados se calculan a continuación:

Página 12 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

El análisis de variancia aparece en la tabla 4. Se concluye que existe

una interacción significativa entre el tipo de material y la temperatura

porque F0.05,4.27 = 2.73. Además, también son significativos los efectos

principales del tipo de material y de la temperatura, porque FO.O5.2.27 =

3.35.

Página 13 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Fuente de

variación SS

G.L

. MS Fo

Tipo de material 10,683.

72

2 5,341.8

6

7.91

Temperatura 39,118.

72

2 19,558.

36

28.9

7

Interacción 9,613.7

8

4 2,403.4

4

3.56

Error 18,230.

75

27 675.21

Total 77,646.

97

35

Tabla 4. ANOVA para los datos de la duración de la batería

Como auxiliar en la interpretación de los resultados de este

experimento resulta útil la construcción de una gráfica de las

respuestas promedio de cada combinación de tratamiento. Esta

gráfica se muestra en la figura 1.

Página 14 de 27

Material tipo 225

50

75

100

125

150

Dur

acio

n pr

om

edio

Temperatura 15 70 125

175

.ijY

Material tipo 1

Material tipo 3

Material tipo 225

50

75

100

125

150

Dur

acio

n pr

om

edio

Temperatura 15 70 125

175

.ijY

Material tipo 1

Material tipo 3

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Figura 1. Gráfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interacción

significativa. En general, a menor temperatura mayor duración,

independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duración aumenta

con el material tipo 3, mientras que disminuye con los materiales tipo

1 y 2,

Cuando la temperatura varía de intermedia a alta, la duración

disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1

esencialmente permanece sin cambio. Al parecer, el material tipo 3

da los mejores resultados si lo que se desea es menor perdida de

duración efectiva al cambiar la temperatura.

Página 15 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

3. Comparaciones Múltiples

i el análisis de variancia indica que hay diferencia en el nivel

medio de los renglones o columnas, resulta de interés llevar a

cabo comparaciones entre las medias individuales de renglón o

columna para descubrir las diferencias específicas para esto, los

métodos de comparación múltiple analizados en él capitulo anterior

resultan útiles.

S

A continuación, se ilustra la aplicación de la prueba de intervalos

múltiples de Duncan a los datos de duración de las baterías del

ejemplo 1. Se recordará que en este experimento la interacción

resultó significativa. Cuando esto ocurre, las diferencias en las medias

de un factor (por ejemplo el A) pueden ser ocultadas por la

interacción AB. Un enfoque consiste en fijar el factor B en un nivel

específico, y aplicar la prueba de intervalos múltiples de Duncan a las

medias del factor A en ese nivel. Para ilustrar esto, supongamos que

en el ejemplo 1 se desea detectar diferencias en el nivel medio de los

tres tipos de material. Como la interacción es significativa, las

comparaciones se realizan en un solo nivel de la temperatura, por

ejemplo el nivel 2 (70 grados). Se supone que el mejor estimador de

la variancia del error es la MSE obtenida de la tabla del análisis de

variancia. Además, se utiliza la suposición de que la variancia del

error experimental es la misma en todas las combinaciones de

tratamientos. Los promedios de los tres tipos de material,

organizados en arden ascendente son:

El error estándar de estos promedios o medias de tratamiento es:

Página 16 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Ya que cada promedio se calcula mediante n = 4 observaciones.

Usando la Tabla VII del Apéndice se obtienen los valores de r0.05(2, 27) =

2.91 y de r0.05(3, 27) = 3.06. Los intervalos mínimos significativos son:

R2 = r0.05(2,27) = (2.91)12.99) = 37.80

R3=r0.05(3,27) = (3.26)(12.99) = 39.75

Y las comparaciones proporcionan:

3 vs. 1 = 145.75 – 57.25 = 88.50 >39.75(R3)

3 vs. 2 = 145.75 – 119.75 = 26.00 <37.80(R2)

2 vs. 1 = 119.75 – 57.25 = 62.50 >37.80(R2)

Este análisis indica que en el nivel de temperatura de 70 grados, el

voltaje medio producido por los materiales 2 y 3 es el mismo y que el

voltaje medio del material 1 es significativamente menor que el

producido por los materiales tipo 2 y 3. Si la interacción resulta ser

significativa, el investigador puede comparar las medias de todas las

ab celdas para determinar en cuáles hay una diferencia significativa.

En este análisis las diferencias entre las celdas incluyen tanto los

efectos principales como el efecto de interacción. En el ejemplo 1

este método producirá 36 comparaciones entre todos los posibles

pares de medias de nueve celdas.

Variabilidad del modelo

plicando el procedimiento general a los datos del voltaje de las

baterías del APágina 17 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Ejemplo 1. Debe observarse que

SSModelo = SSMaterial + SStemperatura + SSinteracción

SSModelo = 10,683.72 + 39,118.72 + 9613.78 = 59,416.22

Y que

R2 = SSModelo/SST = 59,416.22/77,646.97 = 0.765210

En otras palabras, cerca de 77% de la variabilidad en la caída del

voltaje se explica por el tipo de material de las placas de la batería,

por la temperatura y por la interacción entre el tipo de material y la

temperatura.

AComprobación de la idoneidad del Modelo

ntes de poder adoptar las conclusiones del análisis de variancia, debe

probarse la adecuación del modelo supuesto. Como antes, la

herramienta principal es el análisis de residuos. Los residuos para el

modelo factorial de dos factores son:

Página 18 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Para los residuos del ejemplo 3.1 tenemos que:

Tipo deMat.

Temperatura grados Fahrenheit15 70 125

1 130-134.75=-4.75

155-134.75=20.25

-23.25

-17.25

-37.25

12.50

74-134.750=-60.75

180-134.75=45.25

22.75

17.25

24.50

0.50

2 -5.75 32.25 16.25

2.25 -24.50

20.50

3.25 -29.75

-13.75

-4.75

8.50 -4.50

3 -6.00 -34.00

28.25

-25.75

10.50

18.50

24.00 16.00 4.25 -6.75

-3.50

-25.50

Tabla 5. Residuos para el ejemplo 1

Página 19 de 27

J X(J) (j-.5)/n J X(J) (j-.5)/n J X(J) (j-.5)/n

1 -60.8 1.3889 13 -5.8 34.722 25 16 68.056

2 -37.5 4.1667 14 -4.8 37.5 26 16.3 70.833

3 -34 6.9444 15 -4.8 40.278 27 17.8 73.611

4 -29.8 9.7222 16 -4.5 43.056 28 18.5 76.389

5 -25.8 12.5 17 -3.5 45.833 29 20.3 79.167

6 -25.5 15.278 18 0.5 48.611 30 20.5 81.944

7 -24.5 18.056 19 2.3 51.389 31 22.8 84.722

8 -23.3 20.833 20 3.3 54.167 32 24 87.5

9 -17.3 23.611 21 4.3 56.944 33 24.5 90.278

10 -13.8 26.389 22 8.5 59.722 34 28.8 93.056

11 -6.8 29.167 23 10.5 62.5 35 32.3 95.833

12 -6 31.944 24 12.5 65.278 36 45.3 98.611

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Figura 2. Grafica de probabilidad normal e histograma de residuos

para el ejemplo 1.

Página 20 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Tabla 6. Residuos

Figura 3. Gráfica de Residuos versus respuesta estimada

Página 21 de 27

eijk eijk eijk

134.75 -4.75 57.25 -23.25 57.5 -37.5

134.75 -60.75 57.25 22.75 57.5 24.5

134.75 -5.75 57.25 16.25 57.5 -24.5

134.75 3.25 57.25 -13.75 57.5 8.5

155.75 -6 119.75 28.25 49.5 10.5

155.75 24 119.75 4.25 49.5 -3.5

155.75 20.25 119.75 -17.75 49.5 12.5

155.75 45.25 119.75 2.25 49.5 0.5

144 32.25 145.75 -4.75 85.5 20.5

144 -29.75 145.75 -25.75 85.5 -4.5

144 34 145.75 -6.75 85.5 18.5

144 16 145.75 -37.5 85.5 -25.5

.Yij .Yij .Yij

Grafica de residuos vs Yijk(estimador)

-80

-60

-40

-20

0

20

40

60

0 50 100 150 200

Estimador Yijk

eijk

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Y ya que los valores ajustados son (el promedio de las

observaciones en la ij-ésima celda), la Ecuación de residios se

transforma en:

Los residuos de los datos de duración de las baterías del ejemplo 1 se

muestran en la tabla 6. La gráfica de probabilidad normal y el

histograma de estos residuos no revelan algo que pudiera causar

problemas, a pesar de que el residuo menor (-60.75 a 65 °F y para el

tipo de material 1) parece alejarse de los demás. El valor

estandarizado de este residuo es (-60,75)/ (675.21) 1/2 = - 2.34. Éste es

el único residuo cuyo valor absoluto es mayor que dos. En la tabla 7

se presenta una gráfica de los residuos contra los valores ajustados

. Esta gráfica muestra una ligera tendencia de la variancia de los

residuos a aumentar, a medida que aumenta el voltaje.

Tabla 7 Residuos del material

Página 22 de 27

T. Mat eijk T. Mat eijk T. Mat eijk

1 -4.75 1 -23.3 1 -37.5

1 -60.8 1 22.75 1 24.5

1 5.75 1 16.25 1 -24.5

1 3.25 1 -13.3 1 8.5

2 -6 2 28.25 2 10.5

2 24 2 4.25 2 -3.5

2 20.25 2 -17.3 2 12.5

2 45.25 2 17.75 2 0.5

3 32.25 3 2.25 3 20.5

3 -29.8 3 -4.75 3 -4.5

3 -34 3 -25.8 3 18.5

3 16 3 -6.75 3 -25.5Grafica de residuos vs. tipo de material

-80

-60

-40

-20

0

20

40

60

0 0.5 1 1.5 2 2.5 3 3.5

eijk

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Figura 4. Gráfica de residuos versus tipo de material

Tabla 8 Residuos de Temperatura

Página 23 de 27

Temp. eijk Temp. eijk Temp. eijk

15 -4.75 15 -23.25 15 -37.5

15 -60.75 15 22.75 15 24.5

15 -5.75 15 16.25 15 -24.5

15 3.25 15 -13.75 15 8.5

70 -6 70 28.25 70 10.5

70 24 70 4.25 70 -3.5

70 20.25 70 -17.03 70 12.5

70 45.25 70 17.75 70 0.5

125 32.25 125 2.25 125 20.5

125 -29.75 125 -4.75 125 -4.5

125 -34 125 -25.75 125 18.5

125 16 125 -6.75 125 -25.5

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Figura 5 Gráfica de residuos de temperatura versus tipo de material

En la tabla 7 y figura 5 aparecen las gráficas de los residuos contra el

tipo de material y contra la temperatura, respectivamente. Ambas

gráficas indican una ligera desigualdad en la variancia siendo quizá

mayor la variancia de la combinación de 65 °F y tipo de material 1

que la de cualquier otra combinación.

La celda correspondiente a 70 °F y el tipo de material es la que

contiene ambos residuos extremos (-60.75 y 45.25). Estos dos

residuos son los principales responsables de la desigualdad de la

variancia detectada en las Fig. 7,8 y 9.

Un examen posterior de los datos no reveló ningún problema obvio,

como por ejemplo, errores en el registro de los datos y, por lo tanto,

estas observaciones deben ser aceptadas como legítimas. Es posible

que en esta combinación de tratamiento particular se produzcan

voltajes ligeramente más erráticos que en las otras combinaciones.

Página 24 de 27

-80

-60

-40

-20

0

20

40

60

0 20 40 60 80 100 120 140

Temperatura

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Sin embargo, el problema no es tan severo como para tener un efecto

importante en el análisis y las conclusiones.

Estimación de los Parámetros del Modelo

os parámetros en el modelo de análisis de variancia de

clasificación en dos sentidos:L

Pueden estimarse usando el método de mínimos cuadrados. Como

hay 1 + a + b + ab parámetros del modelo que deben ser estimados

habrá 1 + a + b + ab ecuaciones normales. No es difícil mostrar que

las ecuaciones normales son:

Para mayor claridad se muestra el parámetro correspondiente a cada

ecuación normal, a la izquierda de las Ecuaciones anteriores.

Con el fin de obtener una solución óptima a las ecuaciones anteriores,

tenemos que imponer las siguientes restricciones:

Página 25 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

Al aplicar estas restricciones, las ecuaciones normales se simplifican

considerablemente y se obtienen las soluciones:

Estas soluciones son intuitivamente atractivas. Los efectos de los

tratamientos de renglón se estiman mediante la diferencia entre el

promedio del renglón y el promedio general; los efectos de los

tratamientos de columna mediante la diferencia entre el promedio de

la columna y el promedio general, y la ij-ésima interacción se estima

restando el promedio general, el efecto del renglón i y el de la

columna j al promedio de la ij-ésima celda.

Usando la ecuación anterior puede determinarse el valor ajustado de

Yijk mediante:

En otras palabras, la k-ésima observación de la ij-ésima celda se

estima mediante el promedio de las n observaciones de dicha celda.

Suposiciones del análisis de varianza

l aplicar un análisis de varianza se hacen las suposiciones

siguientes:A1. El proceso esta en control estadístico (estable). Esto es, se

pueden repetir y las causas de variación se han eliminado.

Página 26 de 27

EXPERIMENTOS FACTORIALES COMPLETOS P. Reyes / Sept. 2007

2. La distribución de la población que se muestra es normal.

3. La varianza de los errores dentro de los k niveles del factor es la

misma: Esto es, la variabilidad natural dentro de cada tratamiento

es la misma de un tratamiento a otro.

Cuando se observa que no se puede suponer igual varianza (por

ejemplo un proceso Poisson: donde la varianza varia con la media), se

tiene dos opciones; Transformar los datos, o pruebas no

parametricas. En particular una prueba no parametrica que se usa es

la Kruskal – Wallis.

Página 27 de 27