INTRODUCCIÓN A LOS DISEÑOS FACTORIALES

39
4.1 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES En muchas situaciones experimentales resulta de interés estudiar los efectos producidos por dos o más factores simultáneamente; esto se logra con la ayuda de los Diseños Factoriales. En general los Diseños Factoriales producen experimentos más eficientes, ya que cada observación proporciona información sobre todos los factores, y es posible ver las respuestas de un factor en diferentes niveles de otro factor en el mismo experimento. Por lo tanto, se entiende por Diseño Factorial a aquel diseño en el cual se pueden estudiar los efectos de dos o más factores de variación a la vez; es decir, que se puede investigar todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o réplica del experimento. Cada uno de los factores en estudio varían en su aplicación, a esta variación se le llama Niveles del Factor. Las combinaciones de los niveles de cada factor, forman los respectivos tratamientos. En un diseño factorial, los factores en estudio se representan por letras mayúsculas (A,B,C,……) y los niveles de cada uno por sus respectivas letras minúsculas (a,b,c,……). Los cuales pueden tomar valores de 2,3,4, …… Existen experimentos factoriales Balanceados y Desbalanceados; diremos que es balanceado cuando el número de réplicas es igual para cada uno de los tratamientos usados en el experimento; en caso contrario es Desbalanceado; también se puede dar el caso en que sólo exista una sola réplica para cada tratamiento. Los Diseños factoriales se pueden combinar con los Diseños Completamente al Azar (Unifactoriales), o con el Diseño de Bloques Aleatorios, etc., dependiendo de la naturaleza del experimento. Entre las Ventajas de usar un diseño Factorial, se pueden mencionar las siguientes:

Transcript of INTRODUCCIÓN A LOS DISEÑOS FACTORIALES

4.1 INTRODUCCIÓN A LOS DISEÑOS FACTORIALES

En muchas situaciones experimentales resulta de interés estudiar los efectos producidos por dos o más factores simultáneamente; esto se logra con la ayuda de los Diseños Factoriales. En general los Diseños Factoriales producen experimentos más eficientes, ya que cada observación proporciona información sobre todos los factores, y es posible ver las respuestas de un factor en diferentes niveles de otro factor en el mismo experimento. Por lo tanto, se entiende por Diseño Factorial a aquel diseño en el cual se pueden estudiar los efectos de dos o más factores de variación a la vez; es decir, que se puede investigar todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o réplica del experimento.

Cada uno de los factores en estudio varían en su aplicación, a esta variación se le llama Niveles del Factor. Las combinaciones de los niveles de cada factor, forman los respectivos tratamientos.

En un diseño factorial, los factores en estudio se representan por letras mayúsculas (A,B,C,……) y los niveles de cada uno por sus respectivas letras minúsculas (a,b,c,……). Los cuales pueden tomar valores de 2,3,4, ……

Existen experimentos factoriales Balanceados y Desbalanceados; diremos que es balanceado cuando el número de réplicas es igual para cada uno de los tratamientos usados en el experimento; en caso contrario es Desbalanceado; también se puede dar el caso en que sólo exista una sola réplica para cada tratamiento. Los Diseños factoriales se pueden combinar con los Diseños Completamente al Azar (Unifactoriales), o con el Diseño de Bloques Aleatorios, etc., dependiendo de la naturaleza del experimento.

Entre las Ventajas de usar un diseño Factorial, se pueden mencionar las siguientes:

1) Ahorro y economía del recurso experimental; ya que cada unidad experimental provee información acerca de dos o más factores, lo que no sucede cuando se realiza con una serie de experimentos simples.2) Da información respecto a las interacciones entre los diversos factores en estudio.3) Permite realizar estimaciones de las interacciones de los factores, además de los efectos simples.4) Permite estimar los efectos de un factor en diversos niveles de los otros factores, produciendo conclusiones que son válidas sobre toda la extensión de las condiciones experimentales.

La única desventaja es que si el número de niveles de algunos de los factores o el número de factores es demasiado grande, entonces el número de todas las combinaciones posibles de tratamientos de factores llega a ser un número grande, en consecuencia la variabilidad en el experimento podría ser grande.

Estas dos situaciones, pueden hacer difícil detectar los efectos significativos en el experimento.

Se entiende por efecto de un factor al cambio en la respuesta media ocasionada por un cambio en el nivel de ese factor.

En los diseños factoriales existen tres efectos, los cuales son:1) Efecto Simple: son comparaciones entre los niveles de un factor a un

sólo nivel del otro factor.2) Efecto Principal: son comparaciones entre los niveles de un factor promediados para todos los niveles del otro factor.3) Efecto de Interacción: Miden las diferencias entre los efectos simples de un factor a diferentes niveles de otro factor; es decir, la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores.

En un experimento factorial se puede estimar y contrastar hipótesis acerca de las interacciones y los efectos principales.

Existe interacción entre los factores, si la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores.

Una interacción puede ser doble, triple, cuádruple, etc. según el número de factores que sean considerados en el experimento.

En general, el número de efectos principales y las interacciones se pueden determinar:

También se puede utilizar el Triángulo de Pascal para encontrar el número de efectos principales y las interacciones

:La interacción en la cual intervienen tres o más factores se considera una interacción deorden superior. Por ejemplo: ABC, ABD, BCD,ADCE…., etc.

La notación que se utiliza para indicar el número de niveles y el número de factores de un experimento factorial es sencilla; y podría simbolizarse en general de la siguiente manera: mxnxoxpx…………, en donde las letras indican el número de niveles de los factores y el número de veces que aparecen las letras indican el número de factores. En el siguiente cuadro se presentan algunos ejemplos de ésta notación:

En los diseños factoriales se pueden estudiar los efectos de dos, tres y más factores a la vez, en esta unidad se estudiarán los efectos de dos factores en detalle, tres factores y se hará un planteamiento general para el estudio de los diseños de más de tres factores.

4.2 DISEÑO FACTORIAL CON DOS FACTORES

PRESENTACIÓN DEL MODELO

El modelo de diseño de experimentos con dos factores tratamiento con interacción se conoce como modelo completo de dos vías o modelo de análisis de la varianza de dos vías.

Para presentar las formulas generales para el análisis de varianza de un experimento de dos factores que utiliza observaciones repetidas en un diseño por completo aleatorio, debe considerarse el caso de n repeticiones de las combinaciones del tratamiento, determinadas por α niveles del factor A y b niveles del factor B. las observaciones pueden clasificarse usando un arreglo rectangular, donde los renglones representan los niveles del factor A; y las columnas, los factor B. Cada combinación de tratamiento define una celda del arreglo. Así, se tienen ab celdas, cada una de las cuales contiene n observaciones. Se denota con Y ijk la k-èsima observación en el i-èsimo nivel del factor A y el j-èsimo nivel del factor B.

Modelo matemático.

El modelo matemático asociado al diseño de dos factores-tratamiento con interacción y replicado es el siguiente:  

Y ijk=μ+α i+ β j+¿

Para cada

i = 1,2,...,a; j = 1,2,...,b; k = 1,2,...,n,

Con restricciones

Donde:

: Es la media general.

: Es el efecto (positivo o negativo) debido al i-ésimo nivel del factor A.

: Es el efecto (positivo o negativo) del j-ésimo nivel del factor B.

: Representa al efecto de interacción en la combinación ij.

ε ijk : Es el error aleatorio que supone sigue una distribución con media cero

y varianza constante y son independientes entre si.

ESTIMACIÓN DE PARAMETROS

Los parámetros del modelo se obtienen por mínimos cuadrados, técnica que se basa en minimizar la suma de los cuadrados de los residuos.

∑i=1

a

∑j=1

b

∑k=1

n

¿¿¿¿

+n∑i=1

a

∑j=1

b

¿¿¿

Simbólicamente la identidad de cuadrados se escribe así:

SST = SSA + SSB +SS(AB) + SSE

Donde SSA y SSB denominan la suma de cuadrados para los efectos principales A y B, respectivamente, SS(AB) recibe el nombre de suma de cuadrados de la interacción para A y B, y SSE es la suma de errores al cuadrado. La participación de los grados de libertad se efectúa de acuerdo con la identidad

abn−1=(a−1 )+(b−1 )+(a+1 ) (b−1 )+ab (n−1)

*Suma de todas las observaciones

Y ..=∑i=1

a

∑j=1

b

∑k=1

n

y ijk

*Media global

y= y ..abn

*Total en el nivel i del factor A

y i ..=∑j=1

b

∑k=1

n

y ijk

*Media en el nivel i del factor A

y i ..=y i ..

bn

*Total en el nivel j del factor B

y . j .=∑i=1

a

∑k=1

n

y ijk

*Media en el nivel i del factor B

y . j .=y . j .an

TABLA ANOVA PARAMETROS

Fuente Suma de cuadrados V Suma de cuadrados M.

F cal

Efecto A

a – 1

Efecto B

b – 1

Efecto AB

(a-1)(b-1)

Error ab(n-1)

Total abn-1

Manejo de pruebas de hipótesis

*Hipótesis para el efecto A

H 0 ;∝1=∝2=…=∝a=0

H 1 ;∝1≠0 para alguni

La hipótesis nula se rechaza al nivel e significancia cuando

*Hipótesis para el efecto B

H 0 ; β1=β2=…=βb=0

H 1 ; β1≠0 para alguni

La hipótesis se rechaza al nivel e significancia cuando

*Hipótesis para el efecto AB

H 0 ;(∝ β)ij=0 paratodoi

H 1 ;(∝β )ij≠0 para alguni

La hipótesis se rechaza al nivel e significancia cuando

Ejemplo:

La impureza que contiene un producto químico es afectada por dos factores, presión y temperatura. En la tabla 4.2 se muestran los datos de un experimento factorial con una sola replica.

La suma de cuadrados son:

SSA=∑i=1

aYi2

b–Y ..2

ab=23

2+132+82

5− 442

(3 )(5)=23.33

SSB=∑j=1

bY . j2

a–Y ..2

ab=9

2+62+132+62+102

3− 442

(3 )(5)=11.60

SSt=∑i=1

a

∑j=1

b

Yij2 –Y ..2

ab=166−129.07=36.93

y

SSResidual=SS t – SSa– SSb

SSResidual=36.93−23.33−11.60=2.00

La suma de cuadrados debida a la no aditividad del modelo se calcula mediante la ecuación siguiente, tal como aparece a continuación.

∑i=1

a

∑j=1

b

YijYi .Y . j=(5 ) (23 ) (9 )+(4 ) (23 ) (6 )+…+(2 ) (8 ) (10 )=7236

SSn=[∑i=1

a

∑j=1

b

YijYi .Y . j – Y ..(SSA+SSB+Y ..2ab )]abSS ASSB

2

¿[7236−(44 )(23.33+11.60+129.07)]

(3 ) (5 ) (23.33 )(11.60)

2

¿[20.00 ]4059.42

2

=0.0985

Y la suma de cuadrados del error mediante la ecuación siguiente es:

SSError=SSResidual−SS N

¿2.00−0.0985=1.9015

El análisis de varianza completo se muestra en la siguiente tabla. La estadística para aprobar la no aditividad es, Fo = 0.0985/0.2716 = 0.36. por lo que se concluye que estos datos no proporcionan evidencia de una interacción. Los efectos principales de la temperatura y la presión son significativos.

Datos de impurezaTabla 4.2Temperatura(oF)

Presión25 30 35 40 45 Yi.

100 5 4 6 3 5 23125 3 1 4 2 3 13150 1 1 3 1 2 8Y.j 9 6 13 6 10 44 = Y..

Análisis de varianza para el ejemplo anteriorTabla 4.3FUENTE DE VARIACION

SUMA DE CUADRADOS

GRADOS DE LIBERTAD

MEDIA DE CUADRADOS

FO

TEMPERATURA 23.33 2 11.67 42.97PRESION 11.60 4 2.90 10.68NO ADITIVIDAD 0.0985 1 0.0985 0.36ERROR 1.9015 7 0.2716TOTAL 36.93 14

4.3 DISEÑO FACTORIAL CON TRES FACTORES

ESTIMACION DE LOS PARAMETROS DEL MODELO DE EFECTOS FIJOS

Cuando se tiene tres factores (A B y C) y el numero de niveles de prueba en cada uno de ellos son a, b y c, se puede construir el arreglo factorial a*b*c, que consiste de a*b*c tratamientos o puntos experimentales. Entre los arreglos de este tipo que se utilizan con frecuencia entre aplicaciones diversas se encuentra. El factorial 23, el factorial 33 y los factoriales mixtos con no más de cuatro niveles en dos de los factores, por ejemplo, el factorial 4*3*2 y el factorial 4*4*2 por mencionar dos de ellos.

El estudio factorial de tres factores (A, B y C) permitir investigar los efectos: A, B, C, AB, AC, BC y ABC, donde el nivel de desglose o detalle con el que pueden estudiarse depende el número de niveles utilizado en cada factor. Por ejemplo, si un factor se prueba en dos niveles todo su efecto marginal (individual) es lineal, o sea que su efecto individual no se pueda descomponer; pero si tuviera tres niveles, su efecto marginal se puede descomponer en una parte lineal y otra cuadrática pura.

CUADRO DE ANALISIS DE VARIANZA

Tabla ANOVA Para el diseño factorial a*b*c

FV SC GL CM F0 Valor-p

Efecto A SCA a-1 CMA CMA/CME P(F> F0A)

Efecto B SCB b-1 CMB CMB/CME P(F> F0B)

Efecto C SCC c-1 CMC CMC/CME P(F> F0C)

Efecto AB SCAB (a-1)(b-1) CMAB CMAB/CME P(F> F0AB)

Efecto AC SCAC (a-1)(c-1) CMAC CMAC/CME P(F> F0AC)

Efecto BC SCBC (b-1)(c-1) CMBC CMBC/CME P(F> F0BC)

Efecto ABC SCABC (a-1)(b-1)(c-1) CMABC CMABC/CME P(F> F0ABC)

Error SCE abc(n-1) CME

Total SCT abcn-1

donde:

FV: Fuente de Variación.SC: Suma de Cuadrados.

GL: Grados de Libertad.CM: Cuadrado Medio.FO: f Fisher calculado.

Al efecto cuyo valor-p sea menor al valor especificado para ∞, se declara estadísticamente significativo o se dice que está activo. El ANOVA de tres factores dado en la tabla anterior tiene cuatro renglones adicionales, por los nuevos cuatro efectos que pueden estudiarse. Las sumas de cuadrados son muy similares a las obtenidas para dos factores.

FORMULAS

Suma de Cuadrados

Las sumas de cuadrados son muy similares a las obtenidas para dos factores; habrá que considerar un subíndice adicional para el tercer factor, comenzando otra vez por la suma de cuadrados total, éstas resultan ser:

SCT=∑i=1

a

∑j=1

b

∑k=1

c

∑l=1

n

γijk2 −

γ .. .2

N,

donde:

N = abcn es el total de observaciones en el experimento; el subíndice k representa ahora el tercer factor y l las repeticiones. Las sumas de cuadrados de efectos son:

Restando éstas del total, la suma de cuadrados del error resulta ser:

SCE=SCT−SCA−SCB−SCC−SCAB−SC AC−SCBC−SC ABC

Cuyos respectivos grados de libertad se dan en la tabla ANOVA anterior. Una vez hecho el ANOVA, se procede a interpretar los efectos activos, y luego (aunque no necesariamente después) a diagnosticar la calidad del modelo.

Cuadrado Medio

CM=SCGL

Donde:

CM = Cuadrado Medio del efecto

SC = Suma de cuadrado del efecto

GL = Grados de libertad del efecto

Modelo estadístico

En un diseño factorial a*b*c se supone que el comportamiento de la respuesta Y puede describirse mediante el modelo de efectos dado por:

Yijkl = μ +ai + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk + (αβγ)ijk + εijkl;I=1,2,…,a; j=1,2,…,b; k=1,2,…,c; l=1,2,…,n

Donde:

μ = media generalαi = efecto del nivel i-ésimo del factor Aβj = efecto del nivel j del factor Bγk = efecto del nivel k en el factor C(αβ)ij, (αγ)ik, (βγ)jk = efectos de interacciones dobles (de dos factores) en los niveles ij, ik, jk, respectivamente.(αβγ)ijk : efecto de interacción triple en la combinación o punto ijkεijkl : error aleatorio en la combinación ijkll : repeticiones o replicas del experimento

Todos los efectos cumplen la restricción de sumar cero, es decir, son desviaciones respecto a la medida general μ.

EJERCICIO

4.4 DISEÑO FACTORIAL GENERAL

Todos los Análisis hechos para los Diseños de dos y tres Factores pueden extenderse al caso General en el que existen "a" niveles del Factor A, "b" niveles del Factor B, "c" niveles del Factor C,…., y así sucesivamente, ordenados en un Experimento Factorial. Por lo tanto, en general habrá un total de abc…n observaciones si existen n réplicas en el Experimento Completo.

Una generalización del Modelo Lineal del Diseño Factorial General estaría dado por:

REGLAS PARA LAS SUMAS DE CUADRADOS

Las reglas que se presentan a continuación son utilizadas para encontrar las fórmulas matemáticas de las Sumas de Cuadros, cuando se analizan diseños experimentales de tres o más factores; ya que a medida aumenta el número de factores estas expresiones o fórmulas no se pueden determinar fácilmente.

A continuación se plantean estas Reglas tomando como ejemplo el caso de tres factores, para encontrar la suma de cuadrados del factor C:

Regla 3

Los subíndices de cada término del Modelo deben dividirse en tres partes:

i) Activos: son aquellos que se hallan en el término y no están entre paréntesis.

ii) Pasivos: son los subíndices que están presentes en el Modelo pero que se encuentran entre paréntesis.

iii) Ausentes: son aquellos subíndices que están presentes en el Modelo pero que no ocurren en ese término en particular.

Regla 4. Grados de LibertadLos grados de libertad de cualquier término del Modelo corresponden al producto del número de niveles asociados con cada subíndice pasivo, y el número de niveles menos uno, asociados con cada subíndice activo.

Regla 5. Suma de Cuadrados

Para obtener las fórmulas con el fin de calcular las sumas de cuadrados de cualquier efecto, primero se deben desarrollar los grados de libertad de dicho efecto.

b) Los signos de sumatoria deben acomodarse de manera que los relacionados con los subíndices de la forma simbólica de interés (en este caso C), aparezca primero. El resto de los elementos se deben encerrar entre paréntesis. Para C se obtiene.

c) La cantidad entre paréntesis debe transformarse en la notación estándar “punto en el subíndice”, donde el punto que reemplaza al subíndice indica una sumatoria en este

De tres factores.

Nota: SSAC se obtiene de la combinación de las sumas de cuadrados no

corregida en el último renglón, de acuerdo con los signos en la parte superior de cada columna.

REGLAS PARA LAS MEDIAS DE CUADRADOS

Estas reglas son muy útiles para encontrar las Medias de Cuadrados para cualquiera de los Modelos que resultan de un Diseño Factorial de tres o más factores. A continuación se presentan estas reglas, que serán aplicadas a un Diseño con tres factores.

c) En las restantes columnas de los renglones se escribe el número de niveles correspondientes al encabezado de esa columna.

d) Para obtener el valor esperado de la media de cuadrados de cualquier componente del Modelo, primero se cubren todas las columnas encabezadas por los subíndices activos de ese componente. A continuación, en cada renglón que contenga al menos los mismos subíndices que el componente considerado, se calcula el producto de los números visibles y se multiplica por el factor fijo o aleatorio apropiado, obtenido mediante la Regla 1. La suma de estas cantidades corresponden al valor esperado de la media de cuadrados del componente del Modelo considerado.

Estas reglas pueden ser aplicadas a los Modelos que se van estudiando, para obtener los valores esperados de un Modelo de Efectos Mixtos de tres Factores, considerando que el factor A es fijo, el factor B y factor C es aleatorio. Se tiene:

Utilizando estas mismas reglas se obtienen las Medias de Cuadrados Esperados para un Modelo de Efectos Fijos.