Diseño de Experimentos II - dpye.iimas.unam.mxF1o... · Unidad experimental ue. Es la subdivisión...
Transcript of Diseño de Experimentos II - dpye.iimas.unam.mxF1o... · Unidad experimental ue. Es la subdivisión...
Diseño de Experimentos M. en E. Patricia I. Romero Mares
Departamento de Probabilidad y Estadística IIMAS-UNAM
Cursos PUMA Análisis estadísticos para proyectos de investigación
ambiental 30 julio a 3 agosto 2012
Panorama de la clase
Introducción
Ideas básicas del diseño experimental
Diseño completamente al azar, un factor
Suposiciones
Diseños de bloques al azar, un factor
Diseños factoriales, c.a.
Diseños factoriales, bloques
Otros temas
2 Diseño de experimentos 2012
Introducción
Criterios de clasificación de investigaciones
Según el propósito son Descriptivos o Comparativos
Según la evolución son Transversales o Longitudinales
Según la fuente de información son Prospectivos o Retrospectivos
Según el control del investigador son Observacionales o Experimentales
3 Diseño de experimentos 2012
Introducción
Experimento
Estudio comparativo, 2 o más poblaciones
Longitudinal
Prospectivo
Experimental (el investigador aplica tratamientos)
Observacional (el investigador solo observa el fenómeno)
(Pseudoexperimento)
4 Diseño de experimentos 2012
Introducción
El diseño estadístico de experimentos es el proceso de “planear” el experimento de tal manera que se puedan analizar por métodos estadísticos los datos recolectados y que resulten en conclusiones objetivas y válidas.
5 Diseño de experimentos 2012
Introducción (lineamientos)
Objetivos del estudio Qué se va a estudiar
Qué se va a medir
Cómo se va a medir
A quien se va a estudiar
Población objetivo
Población muestra
Muestra población
6 Diseño de experimentos 2012
Introducción (lineamientos)
Factor. Es la característica cuyo efecto queremos estudiar. (Droga A)
Nivel. Es la categoría o modalidad estudiada del factor. (15mg/kg, 20mg/kg, 30mg/kg)
Si los niveles se determinan por el investigador factor fijo.
Si los niveles son una muestra aleatoria de posibles niveles factor aleatorio.
(muestra aleatoria de profundidades de pozos petroleros)
7 Diseño de experimentos 2012
Introducción (lineamientos)
Tratamiento. Combinación de niveles de los factores estudiados.
Tratamiento testigo o control.
(Droga: a1,a2,a3; Manejo: m1,m2,usual)
Unidad experimental ue. Es la subdivisión menor del material experimental que puede recibir un tratamiento en forma independiente.
(rata de laboratorio, jaula con 5 ratas, pozo, lago)
8 Diseño de experimentos 2012
Introducción (lineamientos)
Definir la variable de respuesta. Es lo que se va a medir en cada unidad
experimental.
Se debe estar seguro que dé información útil acerca del fenómeno estudiado.
Se debe tener cuidado en la toma de las mediciones para eliminar sesgos introducidos por operaciones conscientes o inconscientes. (doble ciego)
9 Diseño de experimentos 2012
Introducción (lineamientos)
Elección del diseño experimental. Es la forma de asignar los tratamientos a
las unidades experimentales.
El diseño determina el modelo y el análisis estadístico a seguir.
Homogeneización. Conseguir ue lo más homogéneas posibles para evitar factores de confusión que entorpezcan la comparación de los tratamientos, pero se pierde validez externa.
10 Diseño de experimentos 2012
Introducción (lineamientos)
Aleatorización. Introducida por Fisher, sirve para controlar factores de variación no incluidas en forma explícita. Se busca eliminar sesgos sistemáticos y justificar la independencia de los errores.
Bloques. Un bloque es un grupo de ue homogéneas.
El uso de bloques es la inclusión en el diseño (modelo) de un factor que, aunque no es de interés, se sabe que puede causar una fuerte variación en las ue.
Tiene como objetivo el control de factores de variación en forma explícita en el modelo, disminuyendo así la varianza de los errores.
11 Diseño de experimentos 2012
Introducción (lineamientos)
Ejemplo en agricultura.
B A E D
C BA E D
Bloque 1
Bloque 2
12 Diseño de experimentos 2012
Introducción (lineamientos)
Determinación del número de repeticiones. Las repeticiones (réplicas) son el número
de ue a las que se les aplica, en forma independiente, un tratamiento.
Dan una estimación de la varianza del error experimental
Incrementan la precisión del experimento. A mayor número de repeticiones menor la varianza de los estimadores
13 Diseño de experimentos 2012
Introducción (lineamientos)
Frecuentemente se utiliza dividir una muestra para generar dos observaciones a las que se les llama réplicas cuando en realidad son submuestras o mediciones repetidas.
Por ejemplo, dos mediciones independientes de la estatura de una persona no dan una medida de la variación de estaturas de la población de personas, sino que dan una medida de la variación de la medición de estatura en esa persona.
14 Diseño de experimentos 2012
Introducción (lineamientos)
Es muy importante distinguir entre una submuestra y una réplica, ya que la varianza del error estimada entre las submuestras es, en general, considerablemente menor que la varianza del error estimada entre réplicas.
Por lo tanto, la estadística F de las pruebas, construida usando la varianza del error calculada de las submuestras, será mucho mayor de lo que debe ser, llevando al investigador a encontrar más diferencias significativas de lo que debería.
15 Diseño de experimentos 2012
Introducción (lineamientos)
Hacer el experimento y colectar datos
Efectuar el análisis estadístico
Obtención de conclusiones
16 Diseño de experimentos 2012
Introducción
El error experimental describe la variación entre ue idéntica e independientemente tratadas. Se origina por:
Variación natural entre ue
Variabilidad en la medición de la respuesta
Incapacidad de reproducir las condiciones de los tratamientos exactamente de una ue a otra
Interacción de tratamientos y ue
Cualquier otro factor externo que afecte las características medidas
17 Diseño de experimentos 2012
Introducción
Lo que se busca es tener un diseño que minimice la varianza del error
experimental
18 Diseño de experimentos 2012
Ideas básicas del diseño experimental
Considere un experimento que involucra t tratamientos y cada tratamiento se aplica a r ue diferentes.
El investigador debe seleccionar rt ue. Mientras más parecidas sean las ue mejores serán las comparaciones entre los tratamientos. (homogeneización)
19 Diseño de experimentos 2012
Ideas básicas del diseño experimental
Si el investigador asigna aleatoriamente cada tratamiento a r de las ue (aleatorización) previene la introducción de sesgos sistemáticos en el experimento. Y en caso de que las ue sean un poco heterogéneas, la aleatorización ayuda a que los tratamientos se asignen en formas parecidas a los diferentes tipos de ue.
20 Diseño de experimentos 2012
Ideas básicas del diseño experimental
En muchas ocasiones es imposible seleccionar rt ue homogéneas, lo que contribuye al error experimental. Estos experimentos se mejoran si se pueden agrupar las ue en grupos homogéneos (bloques).
En el caso de uso de bloques, la variación debida al bloque se toma en cuenta en el análisis, reduciendo la varianza del error.
21 Diseño de experimentos 2012
Estructura de tratamientos
Es el conjunto de tratamientos, combinación de los niveles de los factores bajo estudio, o poblaciones que son seleccionadas por el investigador para comparar.
22 Diseño de experimentos 2012
Estructura de tratamientos Unifactorial. Un solo factor con t niveles (t tratamientos)
Factoriales. Dos o más factores
Cruzados (niveles de un factor conservan su significado en cada nivel de otro factor)
Completos (se estudian todas las combinaciones de los
niveles de los factores) Fraccionales (se estudian solo algunas combinaciones de
los niveles de los factores)
23 Diseño de experimentos 2012
Estructura de tratamientos
Factoriales dos o más factores
Anidados (niveles de un factor cambian de significado en cada nivel del otro factor)
Factoriales con uno o más testigos
24 Diseño de experimentos 2012
Estructura de diseño
Es la forma en que se agrupan las ue en conjuntos homogéneos.
La estructura de diseño de un experimento involucra el agrupamiento de las ue de tal manera que las condiciones bajo las cuales se observan los tratamientos sean lo más uniformes posibles.
25 Diseño de experimentos 2012
Estructura de diseño
Si todas las ue son homogéneas, entonces solo hay un grupo o bloque de observaciones y las ue pueden ser asignadas a los tratamientos completamente al azar.
Esta estructura de diseño se llama diseño completamente al azar.
26 Diseño de experimentos 2012
Estructura de diseño
Si se requiere más de un grupo de ue para que dentro de cada grupo las ue sean más homogéneas entre sí que entre grupos, entonces la estructura de diseño es algún tipo de diseño de bloques.
27 Diseño de experimentos 2012
Estructura del diseño
Completamente al azar
Bloques al azar
Bloques al azar generalizados
Bloques incompletos
Cuadros latinos, grecolatinos, hipergrecolatinos
28 Diseño de experimentos 2012
Diseño experimental
Estructura de tratamientos
+
Estructura de diseño
29 Diseño de experimentos 2012
Diseño experimental
Una vez que se seleccionaron la estructura de tratamientos y de diseño, el diseño experimental se especifica describiendo exactamente el método de asignación aleatoria de los tratamientos a las ue en la estructura de diseño.
30 Diseño de experimentos 2012
Diseño experimental
El diseño experimental define el modelo que debe usarse para un análisis correcto. Al construir el modelo, se hacen dos suposiciones básicas: Los componentes de la estructura de diseño son
efectos aleatorios. No hay interacción entre los componentes de la
estructura de diseño y los componentes de la estructura de tratamientos. Es decir, se supone que la relación existente entre los tratamientos será consistente de bloque a bloque, o sea, los bloques no influyen en la relación entre los tratamientos.
31 Diseño de experimentos 2012
Diseño completamente al azar un factor con t niveles
Suponga que tenemos un solo factor con t niveles,
es decir, t tratamientos, y al azar se asignan n ue a
cada tratamiento. Las observaciones se pueden representar por el modelo lineal simple con error experimental en la observación j-ésima del tratamiento i-ésimo. Suponemos independencia entre y dentro de las muestras
1, , 1, ,ij i ij i t j ny
ij
2~ 0,ij NID
32 Diseño de experimentos 2012
Diseño completamente al azar, un factor
Se tienen t muestras independientes de tamaño n
2
11 12 1 1
2
21 22 2 2
2
1 2
, , ,
, , ,
, , ,
n
n
t t tn t
y y y N
y y y N
y y y N
es una muestra aleatoria de
es una muestra aleatoria de
es una muestra aleatoria de
33 Diseño de experimentos 2012
Diseño completamente al azar, un factor
34 Diseño de experimentos 2012
Diseño completamente al azar, un factor
El modelo: es el modelo completo ya que incluye una media separada para cada una de las poblaciones definidas por los tratamientos. Si no hay diferencia entre las medias de las poblaciones Se general el modelo reducido
ij i ijy
1 2 t
ij ijy
35 Diseño de experimentos 2012
Diseño completamente al azar, un factor
El modelo reducido representa la hipótesis de no diferencia entre las medias de las t poblaciones
0 1 2: tH
El modelo completo representa la hipótesis alternativa
: a i kH i k para alguna
¿Cuál de los dos modelos describe mejor a los datos del experimento?
36 Diseño de experimentos 2012
Diseño completamente al azar, un factor
37 Diseño de experimentos 2012
Diseño completamente al azar, un factor
Se requiere un método para estimar los parámetros de los dos modelos y con base en algún criterio
objetivo determinar cuál modelo o hipótesis estadística se ajusta mejor a los
datos del experimento.
38 Diseño de experimentos 2012
Diseño completamente al azar, un factor
Método de mínimos cuadrados.
2
1 1
mint n
ij
i j
SCE
Se minimiza la suma de cuadrados del error en cada uno de los dos modelos y se encuentran los estimadores de los parámetros correspondientes.
39 Diseño de experimentos 2012
Diseño completamente al azar, un factor
Para el modelo completo:
.ˆ
i iy
Para el modelo reducido:
2
1 1
mint n
r ij
i j
SCE y
..ˆ y
2
2
1 1 1 1
mint n t n
c ij ij i
i j i j
SCE y
40 Diseño de experimentos 2012
Diseño completamente al azar, un factor
Entonces se tienen las sumas de cuadrados estimadas del error de los dos modelos al incluir los estimadores de los parámetros
2
.
1 1
2
..
1 1
t n
c ij i
i j
t n
r ij
i j
SCE y y
SCE y y
41 Diseño de experimentos 2012
Diseño completamente al azar, un factor
La diferencia entre estas dos sumas de cuadrados es una medida del grado de concordancia entre hipótesis y datos, tambien llamada Reducción de sumas de cuadrados debida a tratamientos
0H trat r cSC SC SCE SCE
Si es “grande” implica falta de concordancia entre la hipótesis y los datos.
0HSC
42 Diseño de experimentos 2012
Diseño completamente al azar, un factor
r total trat cSCE SC SC SCE
2 22
.. . .. .
1 1 1 1 1 1
t n t n t n
ij i ij i
i j i j i j
y y y y y y
Partición de la suma de cuadrados total en una debida a los tratamientos y otra debida al error. Surge la Tabla de Análisis de Varianza (ANOVA)
43 Diseño de experimentos 2012
Tabla de Análisis de Varianza (ANOVA)
F.V. g.l. S.C. C.M. F
Tratamientos
(entre)
t-1
Error
(dentro)
nt-t
Total nt-1
tratSC
SCE
totalSC
/ 1tratSC t
2
/
ˆ
SCE nt t
tratCM
CME
44 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Si es cierta, entonces 0 1 2: tH
1,~tratc t nt t
E
CMF F
CM
Se fija un nivel de significancia
0 0 I P P H H error tipo rechazar es cierta
45 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Se rechaza si 0 1 2: tH
1,c t nt tF F
46 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Ejemplo de una región de rechazo de H0 (t=5, n=10)
Si Fc > 2.58
se rechaza H0 al
nivel de significancia =0.05
47 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Los paquetes estadísticos calculan el valor p-value (significancia observada) que es la probabilidad de obtener un valor de Fc como el calculado o mayor si la hipótesis nula es cierta.
Si el valor del p-value es pequeño nos lleva a rechazar la hipótesis nula.
48 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Distribución F con 4 y 45 g.l.
F =3.78c
p-value=0.0098 Poco probable haber obtenido este valor de Fc u otro más grande si H0 es
cierta, por lo tanto Se rechaza H0
49 Diseño de experimentos 2012
Análisis de varianza (ANOVA)
Una vez que se rechaza sabemos que hay por lo menos una pareja de medias que son diferentes, pero cuáles son?
0 1 2: tH
50 Diseño de experimentos 2012
Comparaciones múltiples
Son pruebas estadísticas que nos permiten contrastar hipótesis del tipo:
0
1, ,
: :i j a i j
i j t
H vs H
Manteniendo fija la probabilidad del error tipo I por experimento E
51 Diseño de experimentos 2012
Comparaciones múltiples
Tukey (DMSH)
Bonferroni
Student-Newman-Keuls (SNK)
Scheffé
Entre otras
Dunnet (cada tratamiento vs control)
52 Diseño de experimentos 2012
Contrastes
Un contraste es una combinación lineal de las medias definido como i
1
t
i i
i
C k
1
0t
i
i
k
donde
Interesa probar o dar un intervalo de confianza para el contraste. Los contrastes son, generalmente, comparaciones de las medias de los tratamientos planeadas de antemano.
0 : 0H C
53 Diseño de experimentos 2012
Contrastes ortogonales
Existe una clase de contrastes, los contrastes ortogonales. Para t tratamientos existe un conjunto de t-1 contrastes ortogonales que hacen una partición de la Suma de cuadrados de tratamientos en t-1 componentes independientes, cada uno con 1 g.l. Lo que implica que estas pruebas son independientes. Dos contrastes, con coeficientes {ki} y {li}
son ortogonales si
1
0t
i i
i
k l
54 Diseño de experimentos 2012
Modelo unifactorial completamente al azar
1, , 1, ,ij i ijy i t j r
Modelo de medias
Modelo de efectos
1, , 1, ,ij i ijy i t j r
55 Diseño de experimentos 2012
Con la hipótesis 0 1 2: tH
Con la hipótesis 0 1 2: 0tH
Suposiciones
Errores independientes (aleatorización) Errores normales (gráfica en papel normal, histograma) Homogeneidad de varianzas (prueba Bartlett, gráfica de valores estimados vs. residuales) En caso de que no se cumplan las suposiciones:
Transformaciones de la variable y
2~ 0,ij N
56 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
Se tienen datos del flujo de petróleo, medido en barriles por día, de tres pozos en el Golfo de México. Se desea saber si, en promedio, dan la misma producción por día y si no es así se quiere saber cuál es el que produce más.
57 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
Pozo 1 Pozo 2 Pozo 3
157 184 143 135 163 103 152 129
183 174 182 199 183 168 193 162
149 193 129 146 126 132 143 154
58 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
59 Diseño de experimentos 2012
Df Sum Sq Mean Sq F value Pr(>F)
Pozo 2 6304.3 3152.17 7.894 0.002776
Residuals 21 8385.5 399.31
Analysis of Variance Table Response: y
Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = y ~ pozo) $pozo diff lwr upr p adj
2-1 34.75 9.566 59.934 0.006
3-1 0.75 -24.434 25.934 0.997
3-2 -34.00 -59.184 -8.816 0.007
Ejemplo 1 completamente al azar un factor
60 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
61 Diseño de experimentos 2012
Bartlett test of homogeneity of variances
data: residual and pozo
Bartlett's K-squared = 2.9697, df = 2, p-value = 0.2265
Ejemplo 1 completamente al azar un factor
62 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
63 Diseño de experimentos 2012
Ejemplo 1 completamente al azar un factor
Diseño de experimentos 2012 64
Ejemplo 2 completamente al azar un factor
Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento biológico. Cantidades pequeñas de CO2 estimulan el crecimiento de muchos organismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este último efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos.
Se realizó un estudio para investigar el efecto de CO2 sobre la tasa de crecimiento del Pseudomonasfragi, un corruptor de alimentos.
65 Diseño de experimentos 2012
Ejemplo 2 completamente al azar un factor
Se administró CO2 a cinco presiones atmosféricas diferentes. La respuesta es el cambio porcentual en la masa celular después de un tiempo de crecimiento de una hora.
Se utilizaron diez cultivos en cada nivel.
¿Qué conclusiones se deducen del estudio estadístico de estos datos?
66 Diseño de experimentos 2012
Ejemplo 2 completamente al azar un factor
67 Diseño de experimentos 2012
Ejemplo 2 completamente al azar un factor
68 Diseño de experimentos 2012
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
Presion 4 11274 2818.58 101.63 2.2e-16
Residuals 45 1248 27.73
Ejemplo 2 completamente al azar un factor
69 Diseño de experimentos 2012
Tukey multiple comparisons of means
95% family-wise confidence level
$presion
diff lwr upr p adj
0.083 – 0 -13.10 -19.792 -6.408 0.00001
0.29 – 0 -22.69 -29.382 -15.998 0.00000
0.5 – 0 -33.67 -40.362 -26.978 0.00000
0.86 – 0 -42.70 -49.392 -36.008 0.00000
0.29 – .083 -9.59 -16.282 -2.898 0.00167
0.5 - 0.083 -20.57 -27.262 -13.878 0.00000
0.86 - .083 -29.60 -36.292 -22.908 0.00000
0.5 – 0.29 -10.98 -17.672 -4.288 0.00026
0.86 – 0.29 -20.01 -26.702 -13.318 0.00000
0.86 – 0.5 -9.03 -15.722 -2.338 0.00341
Ejemplo 2 completamente al azar un factor
70 Diseño de experimentos 2012
Ejemplo 2 completamente al azar un factor
71 Diseño de experimentos 2012
Bartlett test of homogeneity of variances
data: residual and presion
Bartlett’s K-squared=1.0701, df=4, p-value=0.899
Ejemplo 2 completamente al azar un factor
72 Diseño de experimentos 2012
Diseño de bloques
Un bloque es un grupo de ue homogéneas.
Nuestro objetivo es tener comparaciones precisas entre los tratamientos bajo estudio.
Utilizar bloques es una forma de reducir y controlar la varianza del error experimental para tener mayor precisión.
73 Diseño de experimentos 2012
Diseño de bloques
Una buena elección del criterio de bloqueo resulta en menor variación entre las ue dentro de los bloques comparada con la variación entre ue de diferentes bloques.
Los criterios de bloqueo generalmente son:
Proximidad espacial
Tiempo
Características físicas (edad, peso, sexo)
Manejo de las ue en el experimento
74 Diseño de experimentos 2012
Diseño de bloques
Suponga que se tienen t tratamientos que se quieren comparar en b bloques.
Bloque 1 Bloque 2 Bloque b
11
21
1
...
...
t
y
y
y
12
22
2
...
...
t
y
y
y
...
...
...
...
...
1
2
...
...
b
b
tb
y
y
y
75 Diseño de experimentos 2012
Diseño de bloques
El diseño de bloques completos al azar implica que en cada bloque hay una sola observación de cada tratamiento.
El orden en que se ejecutan los tratamientos dentro de cada bloque es aleatorio (restricción a la aleatorización)
76 Diseño de experimentos 2012
Diseño de bloques
El modelo estadístico para este diseño es:
media general
efecto de i-ésimo tratamiento
efecto del j-ésimo bloque
error experimental del tratamiento i
en el bloque j
1, , 1, ,ij i j ijy i t j b
i
j
ij
2~ 0,ij NID
77 Diseño de experimentos 2012
Diseño de bloques
Se supone que los efectos de tratamientos y bloques son aditivos. Esto significa que no hay interacción entre tratamientos y bloques, es decir, la relación entre los tratamientos es la misma en cada uno de los bloques.
78 Diseño de experimentos 2012
Diseño de bloques
El Análisis de Varianza para este diseño se basa en una descomposición de la variabilidad de las observaciones.
Desv. Total=desv error+desv trat+desv bloques
.. . . .. . .. . ..ij ij i j i jy y y y y y y y y y
79 Diseño de experimentos 2012
Diseño de Bloques. Tabla de Análisis de Varianza (ANOVA)
F.V. g.l. S.C. C.M. F
Tratamientos
t-1
Bloques
b-1
Error
(t-1)(b-1)
Total
bt-1
tratSC
SCE
totalSC
/ 1tratSC t
2
/
ˆ
SCE nt t
tratCM
CME
80 Diseño de experimentos 2012
bloquesSC
Ejemplo 3 Diseño de bloques
Diseño de experimentos 2012 81
Se tienen datos de los depósitos de corcho de 28 árboles en cada de las cuatro direcciones N,S,E,O. Se quiere probar la hipótesis de que las medias de los pesos son iguales en todas las direcciones. Se midió en cada árbol el peso del corcho en las cuatro direcciones, lo que implica que cada árbol es un bloque y los tratamientos son las cuatro direcciones.
Ejemplo 3 Diseño de bloques
Diseño de experimentos 2012 82
Df Sum Sq Mean Sq F value Pr(>F)
direccion 3 569.9 189.96 4.97 0.0032
arbol 27 26135.2 967.97
Residuals 81 3096.4 38.23
Analysis of Variance Table Response: peso
Ejemplo 3 Diseño de bloques
Diseño de experimentos 2012 83
Tukey multiple comparisons of means 95% family-wise confidence level $direccion
diff lwr upr p adj
N-E 4.36 0.02 8.69 0.048
O-E -1.00 -5.33 3.33 0.930
S-E 3.46 -0.87 7.80 0.163
O-N -5.36 -9.69 -1.02 0.009
S-N -0.89 -5.23 3.44 0.949
S-O 4.46 0.13 8.80 0.041
Ejemplo 3 Diseño de bloques
Diseño de experimentos 2012 84
Ejemplo 3 Diseño de bloques
Diseño de experimentos 2012 85
Si no consideramos bloques, es decir, consideramos que tenemos 28x4 árboles diferentes Analysis of Variance Table Response: peso
No hay diferencia significativa entre las 4 direcciones
Df Sum Sq Mean Sq F value Pr(>F)
Direccion 3 569.9 189.96 0.7018 0.553
Residuals 108 29231.6 270.66
Diseño de bloques
Diseño de experimentos 2012 86
Bloques al azar: bloques de tamaño t Bloques al azar generalizados: se repiten los tratamientos en cada bloque Bloques incompletos: los bloques no contienen a todos los tratamientos
Diseño de bloques
Diseño de experimentos 2012 87
Cuadro Latino: Bloqueo en dos direcciones Cuadro Grecolatino: Bloqueo en tres direcciones Cuadro Hipergrecolatino: Bloqueo en cuatro direcciones
Diseños factoriales (estructura de tratamientos)
• Información sobre varios factores. Todas las ue se utilizan para la evaluación de los efectos • Se amplía el rango de validez del experimento al estudiar cada factor en las condiciones representadas por los niveles de los otros factores • Permite el estudio de la interacción, esto es, estudiar el grado y forma en la cual se modifica el efecto de un factor por los niveles de los otros factores
88 Diseño de experimentos 2012
Diseños factoriales (estructura de tratamientos)
Diseño de experimentos 2012 89
• El número de tratamientos es el producto de los niveles de los factores (diseño completo). • Si el número de tratamientos es grande implica que se necesitan muchas ue
Interacción
Ejemplo de un factorial 2x2 sin y con interacción
90 Diseño de experimentos 2012
Diseño factorial
Suponga un experimento con dos factores, A con a niveles Y B con b niveles, en diseño completamente al azar. (Factorial a x b completo, balanceado, efectos fijos)
11 12 1b
21 22 2b
a1 a2 ab
Factor B 1 2 … b Factor A
1 2 . a
91 Diseño de experimentos 2012
Diseño factorial, completamente al azar
El modelo lineal, modelo de medias
2
1, 2, ,
1, 2, ,
~ 0,
ij i ij
ij
i ab
j n
y
N
El modelo de efectos
2
1,2, , 1,2, , 1,2, ,
~ 0,
ijk i j ij ijk
ijk
i a j b k n
y
N
92 Diseño de experimentos 2012
Diseño factorial
•Los dos modelos son equivalentes. •El modelo de efectos está sobreparametrizado así que se hace una reparametrización con variables indicadoras. •En el modelo de medias se realizan las pruebas para los efectos a través de contrastes. •En los dos casos las hipótesis de interés son:
01
02 .
03 .
: 0
: 0
: 0
ij
i i
j j
H i j
H i
H j
para toda y
para toda
para toda
93 Diseño de experimentos 2012
Diseño factorial
• Una interacción significativa oscurece la significancia de los efectos principales • Cuando hay interacción significativa, se deberán estudiar los niveles de un factor, digamos A, con los niveles del o de los otros factores fijos, para tener conclusiones acerca del efecto principal de A.
94 Diseño de experimentos 2012
Diseño factorial
Factor A- +
10
20
30
40
50
B+
B-
y
95 Diseño de experimentos 2012
Diseño factorial completamente al azar. Tabla de ANOVA
F.V. g.l. S.C C.M. F A a-1 SSA SSA /(a-1) CMA / CME
B b-1 SSB SSB / (b-1) CMB / CME
AB (a-1)(b-1) SSAB SSAB / (a-1)(b-1) CMAB / CME
Error ab(n-1) SSE SSE / ab(n-1)
Total abn - 1 SSTot
96 Diseño de experimentos 2012
Ejemplo 4 diseño factorial completamente al azar
Se quiere comparar el tiempo de supervivencia de tres especies de truchas cuando se exponen a una mezcla de metales.
Aproximadamente la mitad de las truchas de cada especie (al azar) fueron el grupo control, se mantuvieron en agua limpia por tres semanas antes de ser transferidas al agua con metales.
97 Diseño de experimentos 2012
Ejemplo 4 diseño factorial completamente al azar
Las otras truchas de cada especie fueron puestas por tres semanas en una mezcla ligera de metales antes de ser transferidos a la mezcla más fuerte.
La variable de respuesta fue el número de horas de supervivencia en la mezcla fuerte de metales.
Diseño de experimentos 2012 98
Ejemplo 4 diseño factorial completamente al azar
Se analizaron estos datos con un modelo 3x2
completamente al azar, sin embargo, no hubo homogeneidad de varianzas entre los 6 grupos.
Diseño de experimentos 2012 99
Ejemplo 4 diseño factorial completamente al azar
Diseño de experimentos 2012 100
Ejemplo 4 diseño factorial completamente al azar
Se calculó la transformación logaritmo natural del
tiempo, lo que se consideró como variable respuesta y se ajustó el mismo modelo.
Diseño de experimentos 2012 101
Ejemplo 4 diseño factorial completamente al azar
Diseño de experimentos 2012 102
1,2 1,2,3 1, ,
ijk i j ijkij
i
y T E TE
i j k n
Media general Efecto del tratamiento Efecto de la especie Efecto de la interacción
iT
jE
ij
TE
Ejemplo 4 diseño factorial completamente al azar
Diseño de experimentos 2012 103
Analysis of Variance Table Response: lntiempo
Df Sum Sq Mean Sq F value Pr(>F)
especie 2 4.58 2.29 17.11 1.64e-07
tratamiento 1 14.48 14.48 108.17 <2.2e-16
especie: tratamiento
2 1.52 0.76 5.69 0.004
Residuals 175 23.43 0.13
Ejemplo 4 diseño factorial completamente al azar
Diseño de experimentos 2012 104
Diseño factorial en bloques al azar
Suponga un factorial axb en p bloques al azar
ab 11 21 22 31 ...... 13
11 21 ab 12 22 ...... 31
21 11 12 13 31 ...... ab
12 21 ab 11 22 ...... 13
Bloque 1
Bloque 2
Bloque p
105 Diseño de experimentos 2012
Diseño factorial en bloques al azar
El modelo:
1, , 1, , 1, ,
( )ijk i j ij k ijk
i a j b k p
y A B AB
Donde es el efecto de bloque y
2~ 0,ijk N
k
106 Diseño de experimentos 2012
Diseño factorial en bloques al azar Tabla de ANOVA
F.V. g.l. S.C C.M. F
Bloques p-1 SSBloque
A a-1 SSA SSA /(a-1) CMA / CME
B b-1 SSB CMB / CME
AB (a-1)(b-1) SSAB CMAB / CME
Error ab(p-1)-p+1 SSE SSE /gle
Total abp-1 SSTot
107 Diseño de experimentos 2012
Diseño factorial axbxc (c.a.)
1, , 1, , 1, , 1, ,
ijkl i j k
ij ik jk
ijklijk
i a j b k c l n
y
108 Diseño de experimentos 2012
Diseño factorial axbxc (c.a.)
10
20
30
40
50
y
10
20
30
40
50
C3C3
C2 C2C1 C1
y
A- A+
B1 B2 B3 B1 B2 B3
Interacción de tres factores A con 2 niveles, B con 3 y C con 3 niveles
109 Diseño de experimentos 2012
Otros temas
Factores aleatorios
Análisis de covarianza
Diseños cruzados
Varias variables dependientes MANOVA
Mediciones repetidas
110 Diseño de experimentos 2012
Bibliografía
Kuehl, R.O. (2000). Design of Experiments: Statistical Principles of Research Design and Analysis. 2nd ed. Brooks/Cole.
Manly,F.J. (2009). Statistics for Environmental Science and Management. 2nd ed. Chapman & Hall
Diseño de experimentos 2012 111
Bibliografía
Milliken, G.A. and Johnson, D.E. (1992). Analysis of Messy Data, Vol. I: Designed Experiments. Chapman & Hall.
Montgomery D.C. (2005). Design and Analysis of Experiments. 6ª. Ed. John Wiley & Sons.
Diseño de experimentos 2012 112
Bibliografía
Reimann,C.,Filzmoser,P.,Garrett,R.G., Dutter,R. (2008). Statistical Data Analysis Explained. Applied Environmental Statistics with R. John Wiley & Sons.
Diseño de experimentos 2012 113