TEMA 2 Diseño de experimentos: modelos con varios...
Transcript of TEMA 2 Diseño de experimentos: modelos con varios...
![Page 1: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/1.jpg)
TEMA 2Diseno de experimentos: modelos con varios factores
Jose R. BerrenderoDepartamento de Matematicas
Universidad Autonoma de Madrid
Analisis de Datos - Grado en Biologıa
![Page 2: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/2.jpg)
Esquema del tema
Modelo bifactorial aditivo.
Modelo bifactorial con interacciones.
Otros modelos y extensiones.
![Page 3: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/3.jpg)
Ejemplo
El abeto posee una regeneracion natural escasa por lo que puede resultarconveniente incrementar su produccion de semillas mediante untratamiento hormonal. Se desean comparar cuatro tipos de hormonas A,B, C y D. Las condiciones naturales de reproduccion en arboles diferentesno son las mismas. Para controlar este efecto, se han seleccionado 10arboles y en cada arbol 4 ramas similares. Cada rama recibe exactamenteuno de los 4 tratamientos. Tras aplicar los tratamientos se mide el numerode semillas producidas en cada rama.
![Page 4: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/4.jpg)
Ejemplo
Arbol A B C D Media
1 89 59 20 51 54.752 87 56 15 47 51.253 84 52 14 45 48.754 92 67 26 56 60.255 95 70 28 60 63.256 90 62 22 53 56.757 89 60 19 51 54.758 88 56 17 50 52.759 82 50 14 45 47.75
10 94 63 24 53 58.50
Media 89.0 59.5 19.9 51.1 54.875
![Page 5: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/5.jpg)
Parte de la variabilidad en la respuesta hay que asignarla a lasdiferencias entre los arboles.
El arbol utilizado es un factor a incluir en el modelo.
¿Como habrıa que haber hecho el experimento para que sı fueseapropiado el modelo unifactorial?
A veces las diferencias entre los niveles de cierto factor no son deinteres directo, pero se disena el experimento teniendo en cuenta estefactor para reducir la variabilidad no explicada.
En este caso al factor se le suele llamar bloque.
![Page 6: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/6.jpg)
En el ejemplo:
El tratamiento hormonal es un factor con cuatro niveles: A, B, Cy D.
El arbol es otro factor (o bloque) con 10 niveles: los 10 arbolesutilizados.
El numero de semillas es la variable respuesta.
Cada combinacion lineal de niveles de los factores es un tratamiento.En el ejemplo hay 40 tratamientos (10 arboles × 4 tipos dehormonas).
![Page 7: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/7.jpg)
Estructura de los datos
Yij es la respuesta correspondiente a la combinacion del nivel i del factorα con el nivel j del factor β.
Factor β1 2 · · · J Medias por filas
1 Y11 Y12 . . . Y1J Y1·Factor α 2 Y21 Y22 . . . Y2J Y2·
......
......
I YI1 YI2 . . . YIJ YI ·Medias por columnas Y·1 Y·2 Y·J Y··
![Page 8: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/8.jpg)
Modelo general
Supongamos que µij es la respuesta esperada para los niveles i (factor α)y j (factor β)
El modelo bifactorial general es:
Yij = µij + uij ,
donde los errores aleatorios uij verifican las hipotesis habituales, es decir,distribucion normal de media 0 y varianza σ2 e independencia.
Con los datos de los abetos no es posible ajustar el modelo general porqueel numero de parametros (41) es mayor que el numero de datos (40).
Esto siempre sucede en un experimento con dos factores en el que hayauna unica respuesta para cada combinacion de niveles: IJ datos y IJ + 1parametros.
![Page 9: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/9.jpg)
Modelo bifactorial aditivo
Una solucion es especificar con mas detalle el valor de µij .
µ: Respuesta media global.
αi : Efecto adicional debido al nivel i del factor α.
βj : Efecto adicional debido al nivel j del factor β
Para i = 1, . . . , I y j = 1, . . . , J,
Yij = µ+ αi + βj + uij ,
donde los errores uij tienen distribucion normal de media 0 y varianza σ2
(la misma para cualquier valor de i y j) y son independientes. Ademas,∑i
αi =∑j
βj = 0,
ya que podemos interpretar αi y βj como desviaciones a la media debidasa los niveles de los factores.
![Page 10: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/10.jpg)
Modelo bifactorial aditivo
El modelo se puede escribir:
Yij ≡ N(µ+ αi + βj ;σ),
donde∑
i αi =∑
j βj = 0 y las variables son independientes.
El modelo aditivo tiene (I − 1) + (J − 1) + 1 + 1 = I + J parametros.Salvo en el caso I = J = 2, siempre IJ > I + J.
El modelo aditivo implica que el efecto en la respuesta del nivel de uno delos factores no depende del nivel fijado para el otro factor.
Se dice que no hay interacciones entre los dos factores.
![Page 11: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/11.jpg)
¿Es razonable un modelo aditivo para los datos de abetos?
Representamos las respuestas como funcion del arbol (una curva de colordiferente para cada tipo de hormona)
2 4 6 8 10
2040
6080
Árbol
Resp
uesta
Si las curvas son aproximadamente paralelas, el modelo aditivo esrazonable.
![Page 12: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/12.jpg)
Estimadores de los parametros
Parametro Estimador
µ µ = Y..αi αi = Yi . − Y..βj βj = Y.j − Y..
Calcula los estimadores de los parametros µ y βj para j = 1, 2, 3, 4 en elejemplo de los abetos.
Los estimadores verifican las mismas restricciones que los parametros, esdecir, ∑
i
αi =∑j
βj = 0
![Page 13: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/13.jpg)
Residuos y valores ajustados
Valores ajustados o pronosticados: Es la parte de la respuesta quelos factores incluidos en el modelo pueden explicar:
Yij = µ+ αi + βj = Yi . + Y.j − Y..
Residuos: Es la parte de la respuesta que los factores incluidos en elmodelo no pueden explicar:
eij = Yij − Yij = Yij − Yi . − Y.j + Y..
Calcula la descomposicion Yij = Yij + eij para la primera fila de datos delejemplo (es decir, cuando i = 1).
¿Cuanto vale la suma de los residuos de cada fila? ¿Y la suma de losresiduos de cada columna?
![Page 14: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/14.jpg)
Variabilidad no explicada y estimacion de la varianza
La suma de los residuos al cuadrado mide la variabilidad no explicada oresidual:
SCR =∑i
∑j
e2ij =
∑i
∑j
(Yij − Yi . − Y.j + Y..)2
Esta suma tiene (I − 1)(J − 1) gl
Normalizando la suma de cuadrados por sus gl se obtiene un estimadorinsesgado de la varianza de los errores (la varianza residual en estemodelo):
S2R =
SCR
(I − 1)(J − 1)=
∑i
∑j(Yij − Yi . − Y.j + Y..)
2
(I − 1)(J − 1)
Puede demostrarse que SCR/σ2 ≡ χ2(I−1)(J−1).
![Page 15: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/15.jpg)
Descomposicion de la variabilidadSe verifica:
Yij − Y.. = αi + βj + eij
Si elevamos al cuadrado y sumamos todos estos terminos:∑i
∑j
(Yij − Y..)2 = J
∑i
α2i + I
∑j
β2j +
∑i
∑j
e2ij
Suma de cuadrados total:
SCT =∑i
∑j
(Yij − Y..)2
Suma de cuadrados debida al factor α:
SCE(α) = J∑i
α2i = J
∑i
(Yi . − Y..)2
Suma de cuadrados debida al factor β:
SCE(β) = I∑j
β2j = I
∑j
(Y.j − Y..)2
![Page 16: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/16.jpg)
Tabla ANOVA
De acuerdo con las definiciones anteriores, se cumple
SCT = SCE(α) + SCE(β) + SCR
¿Cuantos gl tiene cada suma de cuadrados?
Tabla ANOVA para el modelo bifactorial aditivo
Fuente SC gl cuadrados medios FFactor α SCE(α) F (α)Factor β SCE(β) F (β)Residual SCR (I − 1)(J − 1) SCR/[(I − 1)(J − 1)]
Total SCT
![Page 17: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/17.jpg)
Ejemplo
Completa la siguiente tabla ANOVA correspondiente a un modelobifactorial aditivo ajustado a los datos de los abetos:
Fuente Suma de cuadrados gl cuadrados medios estadıstico F
Arbol 886.6Hormona 8078.0Residual 49.7
Total
¿Cual es el estimador de la varianza σ2 en este caso?
Calcula un IC de nivel 95 % para σ2.
![Page 18: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/18.jpg)
Tabla ANOVA con SPSS
Sig.FMedia
cuadráticagl
Suma de cuadrados
tipo III
Modelo corregido
Intersección
arbol
hormona
Error
Total
Total corregida 3925170,375
40145621,000
1,8402749,675
,0004390,6738078,025324234,075
,00053,54698,5149886,625
,00065468,885120450,6251120450,625
,0001137,8272093,3921225120,700 aOrigenOrigen
Pruebas de los efectos inter-sujetos
Variable dependiente:semillas
a. R cuadrado = ,998 (R cuadrado corregida = ,997)
Página 1
![Page 19: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/19.jpg)
Tabla ANOVA con SPSS (interpretacion)
Modelo corregido SCE(α) + SCE(β) = 25120,700Interseccion nY 2
.. = 120450, 625arbol SCE(α) = 886,625hormona SCE(β) = 24234,075Error SCR = 49,675Total
∑i
∑j Y
2ij = 145621
Total corregida SCT = 25170, 375
Coeficiente de determinacion:
R2 =SCE(α) + SCE(β)
SCT=
886,625 + 24234,075
25170,375= 0,998
![Page 20: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/20.jpg)
Contrastes sobre el efecto de los factores en la respuesta
¿Tiene el factor α un efecto significativo sobre la variable respuesta Y ?Para responder planteamos el siguiente contraste de hipotesis:
H0 : α1 = · · · = αI = 0 frente a H1 : αi 6= αj para algun par i , j
Parece razonable afirmar que el efecto del factor es significativo si la partede la variabilidad que el factor explica,
SCE(α) = J(α21 + · · ·+ α2
I ),
es “suficientemente grande”.
Cuando H0 es cierta se verifica
SCE(α)
σ2≡ χ2
I−1.
![Page 21: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/21.jpg)
Contrastes sobre el efecto de los factores en la respuesta
Como no conocemos σ2, lo reemplazamos por su estimador.Cuando H0 es cierta,
F (α) =SCE(α)/(I − 1)
SCR/[(I − 1)(J − 1)]≡ FI−1,(I−1)(J−1)
Un contraste de nivel α para contrastar H0 : α1 = · · · = αI = 0 vienedado por la region crıtica:
R = {F (α) > FI−1,(I−1)(J−1);α}
Escribe la region crıtica para contrastar si el factor β tiene un efectosignificativo sobre la respuesta.
Contrasta, para los datos de abetos, si el tipo de hormona tiene unefecto significativo sobre la respuesta.
Contrasta, para los datos de abetos, si el arbol tiene un efectosignificativo sobre la respuesta.
![Page 22: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/22.jpg)
Comparaciones entre dos niveles de un factor
Un IC de nivel 1− α para la diferencia αi − αj es:[(Yi . − Yj .)∓ t(I−1)(J−1),α/2SR
√1
J+
1
J
]
Para contrastar H0 : αi = αj frente a H1 : αi 6= αj a nivel α, unaposibilidad es rechazar H0 cuando el intervalo anterior no contiene al 0.
¿Cual es la region crıtica que debemos usar para contrastar H0 : αi ≤ αj
frente a H1 : αi > αj?
![Page 23: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/23.jpg)
Comparaciones multiples
Para llevar a cabo m comparaciones con un nivel global αT usamos elmetodo de Bonferroni:
Calcular α = αT/m.
Llevar a cabo cada contraste individual a nivel α (para que el nivel designificacion global sea αT ).
Calcular cada IC individual a nivel 1− α (para que el nivel deconfianza global sea 1− αT .
![Page 24: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/24.jpg)
Comparaciones multiples
Sig.Error típ.Diferencia de medias (I-J)
Límite superiorLímite inferior
Intervalo de confianza 95%
2
3
4
1
3
4
1
2
4
1
2
3
1
2
3
4
32,9329,47,000,60731,20*
-6,67-10,13,000,607-8,40*
-36,17-39,63,000,607-37,90*
-29,47-32,93,000,607-31,20*
-37,87-41,33,000,607-39,60*
-67,37-70,83,000,607-69,10*
10,136,67,000,6078,40*
41,3337,87,000,60739,60*
-27,77-31,23,000,607-29,50*
39,6336,17,000,60737,90*
70,8367,37,000,60769,10*
31,2327,77,000,60729,50*(I)hormona (J)hormona(I)hormona (J)hormona
Comparaciones múltiples
El término de error es la media cuadrática(Error) = 1,840.
*. La diferencia de medias es significativa al nivel 0,05.
Bonferroni
Página 1
![Page 25: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/25.jpg)
Modelo bifactorial con interacciones
Introducimos un nuevo modelo que presenta dos diferencias respecto alanterior:
Permitimos que haya interacciones entre los dos factores: el efectoen la respuesta de cada nivel de un factor puede depender del nivelque fijamos para el otro factor.
El experimento se replica un numero K de veces: para cadacombinacion de niveles i , j se repite el experimento K veces. Sedispone de n = IJK respuestas.
Para cada respuesta Yijk , donde i = 1, . . . , I , j = 1, . . . , J y k = 1, . . . ,Ktenemos:
Yijk = µij + uijk ,
donde las medias µij no estan restringidas y los errores verifican lashipotesis habituales.
![Page 26: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/26.jpg)
Ejemplo
Se asignaron aleatoriamente 20 in-dividuos con sobrepeso (10 hom-bres y 10 mujeres) a dos posiblesdietas con el fin de estudiar su efi-cacia. Despues de 10 semanas deseguimiento de la dieta, se midio laperdida de peso (en libras) en cadaindividuo.
¿Cuanto valen I , J y K en esteejemplo?
Dieta 1 Dieta 2
Mujeres 7.6 19.58.8 17.6
12.5 16.816.1 13.718.6 21.5
Hombres 22.2 30.123.4 24.224.2 9.532.2 14.6
9.4 11.2
![Page 27: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/27.jpg)
Ejemplo
Medias para cada combinacion deniveles (Yij .):
Dieta 1 Dieta 2
Mujeres 12.72 17.82Hombres 22.28 17.92
1 2
1416
1820
22
Dieta
Pér
dida
de
peso
![Page 28: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/28.jpg)
Modelo bifactorial con interacciones
Vamos a escribir el modelo de manera que los parametros reflejen losefectos principales de cada factor y las interacciones.
Respuesta media global: µ = µ..
Efecto adicional debido al nivel i del factor α:
αi = µi . − µ..
Efecto adicional debido al nivel j del factor β:
βj = µj . − µ..
Efecto adicional debido a la interaccion entre los niveles i de α yj de β:
(αβ)ij = µij − µ− αi − βj
Descomposicion de la media: µij = µ+ αi + βj + (αβ)ij .
![Page 29: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/29.jpg)
Modelo bifactorial con interacciones
Para i = 1, . . . , I , j = 1, . . . , J y k = 1, . . . ,K
Yijk = µ+ αi + βj + (αβ)ij + uijk ,
dondeI∑
i=1
αi =J∑
j=1
βj =I∑
i=1
(αβ)ij =J∑
j=1
(αβ)ij = 0
y las variables uijk tienen distribucion normal de media 0 y varianza σ2, yson independientes.
¿Cuantos parametros hay que estimar en este modelo?
¿Que ocurre si no se replica el experimento (K = 1)?
![Page 30: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/30.jpg)
Estimadores de los parametros
Parametro Estimador
µ µ = Y...αi αi = Yi .. − Y...βj βj = Y.j . − Y...
(αβ)ij (αβ)ij = Yij . − Yi .. − Y.j . + Y...
Calcula todos los estimadores de los parametros en el ejemplo de las dietas.
Los estimadores verifican las mismas restricciones que los parametros.
![Page 31: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/31.jpg)
Residuos y valores ajustados
Valores ajustados o pronosticados: Es la parte de la respuesta quelos factores incluidos en el modelo pueden explicar:
Yijk = µ+ αi + βj + (αβ)ij = Yij .
Residuos: Es la parte de la respuesta que los factores incluidos en elmodelo no pueden explicar:
eijk = Yijk − Yijk = Yijk − Yij .
Calcula la descomposicion Yijk = Yijk + eijk para las 5 mujeres que siguenla dieta 1 en el ejemplo.
¿Que restricciones verifican los residuos?
![Page 32: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/32.jpg)
Variabilidad no explicada y estimacion de la varianza
La suma de los residuos al cuadrado mide la variabilidad no explicada oresidual:
SCR =∑i
∑j
∑k
e2ijk =
∑i
∑j
∑k
(Yijk − Yij .)2
Esta suma tiene IJ(K − 1) gl
Normalizando la suma de cuadrados por sus gl se obtiene un estimadorinsesgado de la varianza de los errores (la varianza residual en estemodelo):
S2R =
SCR
IJ(K − 1)=
∑i
∑i
∑k(Yijk − Yij .)
2
IJ(K − 1)
Puede demostrarse que SCR/σ2 ≡ χ2IJ(K−1).
![Page 33: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/33.jpg)
Descomposicion de la variabilidadSe verifica:
Yijk − Y... = αi + βj + (αβ)ij + eijk
Si elevamos al cuadrado y sumamos todos estos terminos resulta
SCT = SCE(α) + SCE(β) + SCE(αβ) + SCR,
donde:
Suma de cuadrados total:
SCT =∑i
∑j
∑k
(Yijk − Y...)2
Suma de cuadrados debida al factor α:
SCE(α) = JK∑i
α2i = JK
∑i
(Yi .. − Y...)2
Suma de cuadrados debida al factor β:
SCE(β) = IK∑j
β2j = IK
∑j
(Y.j . − Y...)2
![Page 34: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/34.jpg)
Descomposicion de la variabilidad
Suma de cuadrados debida a las interacciones:
SCE(αβ) = K∑i
∑j
(αβ)2ij = K
∑i
∑j
(Yij . − Yi .. − Y.j . + Y...)2
Suma de cuadrados residual:
SCR =∑i
∑j
∑k
e2ijk =
∑i
∑j
∑k
(Yijk − Yij .)2
¿Cuantos gl tiene cada una de estas sumas de cuadrados?
![Page 35: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/35.jpg)
Tabla ANOVA para el modelo bifactorial con interacciones
Fuente SC gl cuadrados medios FFactor α SCE(α) I − 1 SCE(α)/(I − 1) F (α)Factor β SCE(β) J − 1 SCE(β)/(J − 1) F (β)
Interacciones SCE(αβ) (I − 1)(J − 1) SCE(αβ)/[(I − 1)(J − 1)] F (αβ)Residual SCR IJ(K − 1) SCR/[IJ(K − 1)]
Total SCT IJK − 1
Coeficiente de determinacion en este modelo:
R2 =SCE(α) + SCE(β) + SCE(αβ)
SCT
![Page 36: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/36.jpg)
Tabla ANOVA con SPSS
Sig.FMedia
cuadráticagl
Suma de cuadrados
tipo III
Modelo corregido
Intersección
Sexo
Dieta
Sexo * Dieta
Error
Total
Total corregida 19935,366
207190,550
44,13616706,172
,1312,535111,8651111,865
,902,016,6851,685
,1242,643116,6451116,645
,000141,7266255,18516255,185
,2011,73176,3983229,194aOrigenOrigen
Pruebas de los efectos inter-sujetos
Variable dependiente:Peso
a. R cuadrado = ,245 (R cuadrado corregida = ,103)
Página 1
![Page 37: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/37.jpg)
Tabla ANOVA con SPSS (interpretacion)
Modelo corregido SCE(α) + SCE(β) + SCE(αβ) = 229,194Interseccion nY 2
... = 6255,185sexo SCE(α) = 116,645dieta SCE(β) = 0,685sexo * dieta SCE(αβ) = 111,865Error SCR = 706,172Total
∑i
∑j
∑k Y
2ijk = 7190,550
Total corregida SCT = 935,366
Coeficiente de determinacion:
R2 =SCE(α) + SCE(β) + SCE(αβ)
SCT=
229,194
7190,550= 0,245
![Page 38: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/38.jpg)
Contrastes sobre los efectos de los factores en la respuesta
¿Tiene la dieta (factor β) un efecto significativo sobre la respuesta?
Contraste: H0 : β1 = · · · = βJ = 0
La variabilidad debida al factor β es:
SCE(β) = IK∑j
β2j = IK
∑j
(Y.j . − Y...)2
Parece razonable rechazar H0 cuando SCE(β) sea suficientemente grande.
Bajo H0,SCE(β)
σ2≡ χ2
J−1.
![Page 39: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/39.jpg)
Contrastes sobre los efectos de los factores en la respuesta
Como no conocemos σ2 lo reemplazamos por su estimador insesgado.
Bajo H0,
F (β) =SCE(β)/(J − 1)
SCR/[IJ(K − 1)]≡ FJ−1,IJ(K−1)
Una region crıtica de nivel α es:
R ={F (β) > FJ−1,IJ(K−1),α
}El contraste para el otro factor, H0 : α1 = · · · = αI = 0, es totalmenteanalogo.
![Page 40: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/40.jpg)
Contrastes sobre las interacciones
En este modelo, podemos tambien preguntarnos si hay interaccionessignificativas entre los dos factores:
H0 : (αβ)ij = 0, para todo i = 1, . . . , I , j = 1, . . . , J
El razonamiento es totalmente analogo al de lo contrastes de los efectosprincipales. La region crıtica de nivel α es:
R ={F (αβ) > F(I−1)(J−1),IJ(K−1),α
},
donde
F (αβ) =SCE(αβ)/[(I − 1)(J − 1)]
SCR/[IJ(K − 1)]
tiene distribucion F(I−1)(J−1),IJ(K−1) bajo H0.
¿Cuales son las conclusiones en el ejemplo de las dietas?
![Page 41: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/41.jpg)
Comparaciones multiples
Para responder a las cuestiones siguientes se razona de manera analoga alos modelos anteriores:
Escribe la formula de un intervalo de confianza de nivel 1− α para ladiferencia βi − βj en este modelo.
Escribe una region crıtica para contrastar a nivel α la hipotesisH0 : αi = αj .
¿Como habrıa que modificar los intervalos si llevamos a cabo mcomparaciones y queremos que el nivel de confianza global sea1− αT ?
![Page 42: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/42.jpg)
Reactivos y catalizadores
Se desea investigar el efecto de cuatro tipos de reactivo y de trescatalizadores en la cantidad de producto resultante en una reaccion. Serepite la reaccion dos veces para cada tipo de reactivo y cada tipo decatalizador y se obtienen las cantidades de producto que aparecen en latabla siguiente:
Cat 1 Cat 2 Cat 3
Reactivo A 4-6 11-7 5-9Reactivo B 6-4 13-15 9-7Reactivo C 13-15 15-9 13-13Reactivo D 12-12 12-14 7-9
![Page 43: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/43.jpg)
Tabla ANOVA del modelo bifactorial con interacciones:
Pruebas de los efectos inter-sujetos
Variable dependiente: producto
252,000a 11 22,909 5,727 ,0032400,000 1 2400,000 600,000 ,000
48,000 2 24,000 6,000 ,016120,000 3 40,000 10,000 ,001
84,000 6 14,000 3,500 ,03148,000 12 4,000
2700,000 24300,000 23
FuenteModelo corregidoInterseccióncatalizareactivocataliza * reactivoErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,840 (R cuadrado corregida = ,693)a.
![Page 44: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/44.jpg)
Modelo bifactorial con interacciones: algunas cuestiones
Calcula un estimador del efecto principal del reactivo A.
Calcula un estimador del efecto principal del catalizador 1.
Calcula un estimador del parametro que mide la interaccion entre el reactivo A y elcatalizador 1.
Calcula el valor pronosticado para la cantidad de producto obtenida cuando se utiliza elreactivo A y el catalizador 1.
Calcula los residuos para las observaciones correspondientes al tratamiento del apartadoanterior.
¿Cual es la tabla ANOVA correspondiente a un modelo bifactorial aditivo que no incluyeinteracciones? Escribe este modelo.
¿Hay alguna diferencia entre las conclusiones obtenidas usando el modelo aditivo y usandoel modelo con interacciones?
![Page 45: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/45.jpg)
Tabla ANOVA para el modelo aditivo
Pruebas de los efectos inter-sujetos
Variable dependiente: producto
168,000a 5 33,600 4,582 ,0072400,000 1 2400,000 327,273 ,000
48,000 2 24,000 3,273 ,061120,000 3 40,000 5,455 ,008132,000 18 7,333
2700,000 24300,000 23
FuenteModelo corregidoInterseccióncatalizareactivoErrorTotalTotal corregida
Suma decuadrados
tipo III glMedia
cuadrática F Significación
R cuadrado = ,560 (R cuadrado corregida = ,438)a.
&[PageTitle]
Página 1
![Page 46: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/46.jpg)
Modelos con tres o mas factores
Un modelo general con tres factores, α, β y γ incluye:
Media global: µ
Efectos principales: αi , βj , γk
Interacciones de segundo orden: (αβ)ij , (αγ)ik , (βγ)jk
Interacciones de tercer orden: (αβγ)ijk
SPSS permite seleccionar cuales de estos parametros queremos incluir enel modelo y nos da la correspondiente tabla ANOVA, cuyo analisis esanalogo al de los modelos que ya hemos visto.
El numero de observaciones requeridas para ajustar estos modelos crecemuy rapido.
¿Cuantas observaciones son necesarias para ajustar un modelo completocon 3 factores y 4 niveles cada uno?
![Page 47: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/47.jpg)
Diseno por cuadrados latinos
Es un diseno alternativo que requiere menos observaciones.
Se puede aplicar cuando:
Hay tres factores.
Todos los factores se presentan con el mismo numero de niveles K .
No hay interacciones entre los factores.
El diseno por cuadrados latinos requiere unicamente K 2 observaciones.
En este diseno cada nivel de un factor aparece una unica vez con cada unode los niveles de los otros factores.
![Page 48: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/48.jpg)
Diseno por cuadrados latinos
![Page 49: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/49.jpg)
Diseno por cuadrados latinos: ejemplo
En un estudio se mide la velocidad de lectura (numero de palabras leıdaspor minuto) bajo distintas circunstancias:
Tipo de papel: Satinado, Blanco o Color.
Tamano de letra: Grande, Normal o Pequena.
Iluminacion: Natural (A), Muy fuerte (B), Escasa (C).
Diseno del experimento y respuestas obtenidas:
¿Cuántos factores se consideran en el experimento? Construir con SPSS la tabla de análisis de la varianza y contrastar, con un nivel de significación α=0,05, si los factores afectan a la velocidad de lectura.
8.- Se realiza un seguimiento para estudiar la posible influencia de dos factores sobre el número de visitantes a los parques nacionales. Los factores considerados son: el clima (seco o húmedo) y el departamento encargado de la conservación (A, B ó C). Los datos que se obtienen son:
A B CSeco 60 73 85Húmedo 63 69 88
(a) Plantear el modelo y las hipótesis asumidas para hacer el estudio con los datos disponibles, razonando la elección del modelo. Estimar la influencia adicional del clima húmedo sobre el número medio global de visitantes.
(b) ¿Influye el clima sobre el número de visitantes? ¿Influye el departamento encargado de la conservación? Dar respuestas razonadas con un nivel de significación del 5%.
9.- Un laboratorio de medición atmosférica ha adquirido un nuevo equipo para medir ozono. Para evaluar si el nuevo equipo está calibrado, se realiza un pequeño experimento en 5 observatorios diferentes. En cada observatorio se toma una medida con el nuevo equipo (que llamaremos B) y otra con el equipo antiguo (que llamaremos A), obteniéndose los siguientes resultados:
Obs. 1 Obs. 2 Obs. 3 Obs. 4 Obs. 5Equipo A 215 305 247 221 286Equipo B 224 312 251 232 295
Teniendo en cuenta que la suma de cuadrados totales (SCT) es 12491,6, proponer un modelo adecuado para explicar los niveles de ozono que se han observado en el experimento y contrastar si existen diferencias significativas entre los dos equipos, con nivel de confianza 0,95.
10.- En una investigación de laboratorio se emplean cámaras de crecimiento para estudiar el desarrollo de ciertos microorganismos cuando se varían las concentraciones de CO_2 (baja y alta), y la temperatura (baja, media y alta). En distintas cámaras se
![Page 50: TEMA 2 Diseño de experimentos: modelos con varios factoresverso.mat.uam.es/~joser.berrendero/cursos/adatos/ad2-tema2-12.pdf · TEMA 2 Diseno~ de experimentos: modelos con varios](https://reader030.fdocuments.es/reader030/viewer/2022040219/5e1428a89107fe187d231455/html5/thumbnails/50.jpg)
Diseno por cuadrados latinos: ejemplo
Sig.FMedia
cuadráticagl
Suma de cuadrados
tipo III
Modelo corregido
Intersección
Iluminacion
Tamaño
Papel
Error
Total
Total corregida 82338,000
9529414,000
4,33328,667
,06614,07761,0002122,000
,03131,000134,3332268,667
,004223,692969,33321938,667
,000121632,923527076,0001527076,000
,01189,590388,22262329,333 aOrigenOrigen
Pruebas de los efectos inter-sujetos
Variable dependiente:Velocidad
a. R cuadrado = ,996 (R cuadrado corregida = ,985)
Página 1