DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES...

141
DISEÑOS nFACTORIALES COMPLEJOS Luis M. Carrascal (www.lmcarrascal.eu) Grupo de Biogeografía Ecológica Integrativa Museo Nacional de Ciencias Naturales, CSIC modelos ENCAJADOS modelos MIXTOS diseños de BLOQUES diseños MULTIVARIANTES modelos de MEDIDAS REPETIDAS modelos SPLITPLOT curso de la Sociedad de Amigos del Museo Nacional de Ciencias Naturales impartido en Febrero de 2017 1

Transcript of DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES...

Page 1: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES COMPLEJOSLuis M. Carrascal(www.lmcarrascal.eu)

Grupo de Biogeografía Ecológica IntegrativaMuseo Nacional de Ciencias Naturales, CSIC

modelos ENCAJADOSmodelos MIXTOS

diseños de BLOQUESdiseños MULTIVARIANTES

modelos de MEDIDAS REPETIDASmodelos SPLIT‐PLOT

curso de la Sociedad de Amigos del Museo Nacional de Ciencias Naturales impartido en Febrero de 20171

Page 2: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOS

n way ANOVAScon factores anidados(modelos ENCAJADOS)

2

Page 3: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la VarianzaEn estos diseños se establece que el efecto de un factor A no está cruzado en los niveles de otro factor B. Esto es, no se define una interacción A*B.

Esto puede ser así por: el interés del investigadorla imposibilidad de representación de los niveles de un factor en los de otro factor

este es el caso en el que un factor FAMILIA no está representado en otro factor ORDENen este esquema de sistemática lineana, GENERO dentro‐de FAMILIA dentro‐de ORDEN

Análisis Encajados de la VarianzaLa opción "MSerror de todo el modelo"

… se utiliza en diseños de efectos FIJOS. 

La opción "MS del efecto de orden jerárquico inmediatamente inferior"… se utiliza en diseños de factor(es) anidado(s) ALEATORIOS. 

3

Page 4: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la VarianzaLa clave en estos diseños encajados (anidados) de efectos aleatorios (o de celdas vacías) está en definir el término error (MS y g.l.)

El MS denominador (MSerror) de la F de Fisher es:el MS del efecto de orden jerárquico inmediatamente inferior

ejemplo:el MSerror para ESPECIE es el MS del efecto INDIVIDUO dentro‐de ESPECIE (MSerror del modelo)el MSerror para GENERO es el MS del efecto ESPECIE dentro‐de GENEROel MSerror para FAMILIA es el MS del efecto GENERO dentro‐de FAMILIAel MSerror para ORDEN es el MS del efecto FAMILIA dentro‐de ORDEN

Si no queremos complicarnos con la definición de efectos fijos y aleatorios, podemos calcular manualmente las F, p y g.l. utilizando los términos correctos que podemos obtener en las tablas de ANOVA.

4

Page 5: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la VarianzaEjemplo con un diseño de efectos fijos con término MSerror común:Anidamos una secuencia de efectos fijos (cada factor tiene dos niveles):el efecto de la EDAD se anida dentro de SEXO que se anida dentro de ZONApara ZONA se efectúa 1 comparación entre sus dos niveles (del factor)  1 g.l. ó d.f.para SEXO se efecúan 2 comparaciones (1 en cada ZONA)  2 g.l. ó d.f.para EDAD se efecúan 4 comparaciones (2 dentro de SEXO en las ZONAs)  4 g.l ó d.f.

Y ~ A/B B está encajado en A es como Y ~ A + B %in% A

eqt <- as.formula(MUSCULO~TARSO+ZONA/SEXO/EDAD)modelo <- lm(eqt, data=datos)Anova(modelo, type=3, test="F")

Anova Table (Type III tests)

Response: MUSCULOSum Sq Df F value Pr(>F)

(Intercept) 0.1574 1 1.1389 0.2946890 TARSO 0.7399 1 5.3523 0.0279834 * es una covarianteZONA 1.9958 1 14.4380 0.0006872 ***ZONA:SEXO 1.5928 2 5.7614 0.0078187 ** ZONA:SEXO:EDAD 1.1925 4 2.1568 0.0990707 . Residuals 4.0087 29 5

Page 6: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la VarianzaEjemplo con un diseño de efectos aleatorios con término MSerror NO común:

Para el caso de que los niveles de un factor de orden jerárquico inferior no esténrepresentados en todos los niveles de otro factor de orden jerárquico superior

Anidamos una secuencia de efectos:el efecto de la covariante se anida en el BOSQUE, que se anida dentro de REGION

Hay celdas vacías y no funcionará Anova(…). Usaremos anova que emplea SS tipo I

eqt <- as.formula(egagrop_1011 ~ REGION/BOSQUE/covariante)

modelo <- lm(eqt, data=datos)anova(modelo)

Analysis of Variance Table

Response: egagrop_1011Df Sum Sq Mean Sq F value Pr(>F)

REGION 2 116598 58299 18.0612 5.783e-08 ***REGION:BOSQUE 23 120021 5218 1.6166 0.04217 * REGION:BOSQUE:covariante 26 246808 9493 2.9408 9.921e-06 ***Residuals 210 677854 3228

6

Page 7: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la VarianzaEjemplo con un diseño de efectos aleatorios con término MSerror NO común:

haremos los cálculos correctos de modo manual utilizando los Mean Sq (MSefecto)

Analysis of Variance Table

Response: egagrop_1011Df Sum Sq Mean Sq F value Pr(>F)

REGION 2 116598 58299 18.0612 5.783e-08 ***REGION:BOSQUE 23 120021 5218 1.6166 0.04217 * REGION:BOSQUE:covariante 26 246808 9493 2.9408 9.921e-06 ***Residuals 210 677854 3228

Para la covariante dentro de cada BOSQUE (10 árboles por bosque)F para REGION:BOSQUE:covariante = 9493 / 3228 = 2.9408 d.f. = 26, 210

Para el BOSQUE dentro de cada REGION  (hay 9, 9 y 8 bosques en las tres regiones)F para REGION:BOSQUE

controlando por la covariante = 5218 / 9493 = 0.5497 d.f. = 23, 26sin controlar por la covariante = 5218 / 3228 = 1.6165 d.f. = 23, 210

Para comparar los niveles de REGION (hay tres regiones)F para REGION = 58299 / 5218 = 11.1727 d.f. = 2, 23

7

Page 8: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la Varianza¿Cuándo establecer efectos anidados dentro de un factor?Siempre que queramos valorar el efecto de un predictor, sea continuo (covariante ) o nominal (factor), de manera no homogenea dentro de nuestra muestra, sino distinguiendo entre las situaciones definidas por otro factor.

También será una necesidad cuando contemos con diseños de “celdas vacías”, porque los niveles de un factor no estén representados en otro factor, y ambos factores no se puedan cruzar estableciendo la interacción.

ejemplo: caso de factores sistemáticos (ORDEN, FAMILIA, GÉNERO, … que no están representados)

Esto es una necesidad cuando existen interacciones significativas entre covariantes y factores (test de paralelismo del ANCOVA).

También puede ser interesante cuando haya interacciones significativas entre dos o más factores, de manera que no se pueda generalizar el efecto de un factor en toda la muestra, ya que es dependiente de los estados definidos por otro factor.

En el caso de que una covariante manifieste valores muy diferentes en los niveles de determinados factores y se sospeche que no se pueda generalizar su efecto.

veamos este aspecto de modo gráfico en la siguiente página8

Page 9: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Encajados de la Varianza¿Cuándo establecer efectos anidados dentro de un factor?Caso de una covariante con valores muy diferentes en los niveles de un factor.No hay violación de paralelismo, pero el efecto global es muy diferente de lo observado en los niveles de un factor.

9

los modelos de la covarianteexplicando la respuesta son

¡¡paralelos!!definen relaciones negativas

cuando el “falso” patrón globales positivo

Page 10: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOS

n way ANOVAScon factores ALEATORIOS

(modelos MIXTOS)

10

Page 11: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSLa novedad es introducir factores de efectos aleatorios.Son factores cuyos niveles representan una muestra de la realidad, obtenida pormuestreo aleatorio de ella (familias, parcelas, individuos que re‐muestreo, etc).

La clave de estos diseños está en definir los términos error (MS y df).Podemos distinguir dos aproximaciones para el cálculo de los denominadores de la F para

estimar la significación de los efectos aleatorios en modelos mixtos:la Restricted y la Unrestricted.

Quinn, G.P.; Keough, M.J. (2002). Experimental design and data analysis for biologists. Cambridge Univ. Press, Cambridge. 11

Page 12: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSDefinición de términos error (MS y df).

12

Page 13: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSEstructura de datos y "tamaños muestrales"Ejemplo:

13

38 individuos (niveles de factor aleatorio)dos situaciones de muestreo (factor fijo)

6 réplicas en un nivel del factor4 réplicas en el otro nivel del factor

el tamaño muestral correctopara el efecto del factor fijo NO ES 38*(4+6) = 380ES 38 individuos medidos en 2 situaciones

38 individuos * 2 situaciones = 76lo define la interacción fijo * aleatorio

Page 14: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSLas hipótesis nulas en los modelos mixtos son las siguientes:

FACTORES FIJOS (FF): las medias (μ) de los diferentes niveles de un factor FF son iguales.factor fijo FF con n niveles: μ1 = μ2 = μ3 = … = μn

COVARIANTES: el coeficiente de regresión es cero.respuesta = f(factores) + b*covariante     b=0

FACTORES ALEATORIOS (FR): la varianza (σ2) asociada al factor aleatorio FR es cero.σFR2 = 0

Lecturas recomendadas:Using Mixed‐Effects Models for Confirmatory Hypothesis Testing

http://talklab.psy.gla.ac.uk/simgen/faq.html

14

Page 15: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSTipos de diseños atendiendo a si los efectos aleatorios afectan:al intercepto y/o a las pendientes de los efectos predictores fijos.

15

con INTERCEPTOsin interacciones entre

efectos FIJOS*ALEATORIOS

con INTERCEPTOcon interacciones entre

efectos FIJOS*ALEATORIOS

sin INTERCEPTOcon interacciones entre

efectos FIJOS*ALEATORIOS

Page 16: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSVamos a mezclar efectos "fijos" (factores y covariantes) con efectos "aleatorios" (Random).

16

F = 0.060 / 0.191 = 0.31d.f. = 3, 3

NO UTILIZAMOS el términoResidual

ejemplo:

Page 17: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSejemplo: Definición de términos error (MS y df) con efectos aleatorios encajados.

17

Page 18: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Algo de nomenclatura:

## consultad: https://cran.r-project.org/web/packages/lme4/vignettes/lmer.pdf## the lone random effects model; A is randomlmer(Y ~ 1 + (1 | A), data=d)## Random effects, like (1 | A), are parenthetical terms containing## a conditioning bar and wedged into the body of the formula.

## A and B are both random and crossed (i.e. marginally independent)lmer(Y ~ 1 + (1 | A) + (1 | B), data=d)

## B is fixed but A is random## the Random Intercept model## (B | A) is equivalent to (1 + B | A)## these two models produce identical resultslmer(Y ~ B + (1 | A), data=d)lmer(Y ~ 1 + B + (1 | A), data=d)

## A is random; both the intercept and the slope of B (fixed) depend on A.## the Random intercept and Random slopes model## with no constraint on the slope-intercept relationship## these two models produce identical resultslmer(Y ~ 1 + B + (1 + B | A), data=d)lmer(Y ~ B + (B | A), data=d)

18

Page 19: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Algo de nomenclatura:

## A is random and B is fixed## To force B's intercept and slope to be independent conditional on A:## a rare situation where it is sensible to remove an intercept,## we remove the slope-intercept relationship## these two models produce identical resultslmer(Y ~ 1 + B + (1 | A) + (0 + B | A), data=d)lmer(Y ~ B + (B || A), data=d)

## Nested variables: ## if A is random, B is fixed, and B is nested within A:lmer(Y ~ B + (1 | A:B), data=d)

## Levels of (random) B are nested within levels of (random) A## these two models produce identical resultslmer(Y ~ 1 + (1 | A) + (1 | A:B), data=d)lmer(Y ~ 1 + (1 | A/B), data=d)## The last expresses the nesting and ensures that## we don't accidentally do a crossed factor analysis.

19

Page 20: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## CARGAMOS PAQUETES DE ANÁLISIS

library(lme4) ## generalized mixed modelslibrary(lmerTest) ## para MS, df, p ... usando type 3/type 1 hypotheses with

## "Satterthwaite" and "Kenward-Roger"library(pbkrtest) ## necesario para lmerTestlibrary(car) ## para Anova(modelo, type=3) para equivalente a suma de tipo III

## para boxCox(modelo, lambda=seq(-2,2, 1/100))library(MuMIn) ## para AICclibrary(lmtest) ## para lrtestlibrary(psych) ## para tabla de promedios con describe y describeBylibrary(lattice) ## para plots de residuoslibrary(arm) ## para correr simulaciones con modelos merModlibrary(phia) ## para plots de interacciones

20

Page 21: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## DEFINIMOS LAS TABLAS DE CONTRASTES PARA LOS FACTORES## antes de crear nuestros modelos Factoriales cargamos la siguiente línea## de código para obtener los mismos resultados que STATISTICA y SPSS## utilizando type III SS.## As the treatment factors are unordered factors, R will use contr.sum## in order to construct a contrast matrix of the apropriate order.

options(contrasts=c(factor="contr.sum", ordered="contr.poly"))

## Vamos a trabajar con REstricted Maximum Likelihood: ## lemermethod es "REML"; REML=TRUE por defecto## para cambiarlo a ML (log-likelihood) añadir REML=FALSE

## CREAMOS DIFERENTES MODELOS## Intraclass correlation: the "unconditional means model"## (or "null model"); Random intercept with fixed meanm0 <- lmer(ln_uso10h ~ 1+(1|individuo), data=datos)

## Random intercept, fixed slopesm1 <- lmer(ln_uso10h ~ temperatura+distancia+(1|individuo), data=datos)

21

Page 22: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## CREAMOS DIFERENTES MODELOS## diferentes pendientes e interceptos; Random intercept and Random slopes## Correlated random intercept and slope, with## UNCORRELATED random slopes for different covariatesm2 <- lmer(ln_uso10h ~ temperatura+distancia+(temperatura|individuo)+(distancia|individuo), data=datos)

## diferentes pendientes e interceptos; Random intercept and Random slopes## Correlated random intercept and slope, with## with CORRELATED random slopes for different covariatesm3 <- lmer(ln_uso10h ~ temperatura+distancia+(temperatura+distancia|individuo), data=datos)

## Efectos anidados## Random intercept model; ambos factores son aleatoriosm7 <- lmer(ln_uso10h ~ 1+(1|spp/individuo), data=datos)

## Random intercept and slopes models; spp es fijo e individuo es aleatorio## estos dos siguientes dan lo mismom8 <- lmer(ln_uso10h ~ spp+(1|individuo), data=datos)m9 <- lmer(ln_uso10h ~ spp+(1|spp:individuo), data=datos)

22

Page 23: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## creamos los modelos## Vamos a trabajar con REstricted Maximum Likelihood: lemermethod es "REML" ## (REML=TRUE por defecto); para cambiarlo a ML (log-likelihood) REML=FALSE## modelo de interés de “random intercepts and slopes”options(contrasts=c(factor="contr.sum", ordered="contr.poly"))modelo <- lmer(ln_uso10h ~temperatura+distancia+spp+

(temperatura|individuo)+(distancia|individuo), data=datos, REML=TRUE)

## modelos “nulo” m0 (sólo el efecto aleatorio) y de “random intercepts” m1m0 <- lmer(ln_uso10h ~ 1+(1|individuo), data=datos, REML=TRUE)m1 <- lmer(ln_uso10h ~ temperatura+distancia+spp+(1|individuo), data=datos, REML=TRUE)

## Si tenemos tablas de contrastes particulares que queremos examinar,## ese contraste para el efecto mi.factor lo añadimos con su.contraste## e.g.: su.contraste <- matrix(c(-3, -1, 1, 3), ncol=4) ## lmer(..., contrasts=list(mi.factor=su.contraste, ...))

## si hay problemas de estimas y convergencia## introducir en lmer(..., control=mi.control) lo siguiente:mi.control <- lmerControl(check.conv.grad=.makeCC(action ="ignore", tol=1e-6, relTol=NULL),

optimizer="bobyqa", optCtrl=list(maxfun=100000))

## para ver sus características teclear: str(lmerControl(...))str(mi.control) 23

Page 24: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## ¿Qué contiene el modelo?## Para ver su contenido, no funciona names(modelo). Usaremos el comando strstr(modelo)

## para más detalles mirad en la ventana de ayuda “MerMod-class”## o en http://www.inside-r.org/packages/cran/lme4/docs/terms.merMod

## La matriz de datos usada (siendo la primera columna la variable respuesta)modelo@frame## La fórmula usada está en:modelo@call## El logLikelihood está en:logLik(modelo)## La devianza está en:deviance(modelo, REML=TRUE)## La matriz de varianzas/covarianzas está en:vcov(modelo)## Los residuos están en:residuals(modelo)

24

Page 25: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## RESIDUOS DEL MODELO## Exploración visual de la normalidad de los residuos del modelohist(residuals(modelo), density=5, freq=FALSE, main="residuos del modelo", ylim=c(0,0.25))curve(dnorm(x, mean=mean(residuals(modelo)), sd=sd(residuals(modelo))), col="red", lwd=2, add=TRUE, yaxt="n")

##qqnorm(residuals(modelo), main="residuos del modelo")qqline(residuals(modelo), col="red", lwd=2)#### para otro qqnorm identificando valores con residuos extremos## ponemos en id la proporción de residuos extremos (e.g., id=0.02, el 2%)qqmath(modelo, id=0.02, main="2% de residuos extremos")#### Exploración visual de la heterocedasticidad de los residuosplot(fitted(modelo), residuals(modelo), main="¿HAY HETEROCEDASTICIDAD?")abline(h=0, col="red")###### otra posibilidad sintética es:mcp.fnc(modelo)#### Exploración analítica del desvío de los residuos de la normalidad## test de Shapiro-Wilk de normalidad de residuosshapiro.test(residuals(modelo))

25

Page 26: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

> shapiro.test(residuals(modelo))Shapiro‐Wilk normality test

data:  residuals(modelo)W = 0.9513, p‐value = 7.017e‐10

26

Page 27: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

27

Page 28: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

28

Page 29: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## VALORES OBSERVADOS Y PREDICHOSpredicho <- fitted(modelo)plot(modelo@frame[,1] ~ predicho, ylab="RESPUESTA", xlab="PREDICCIONES")abline(lm(modelo@frame[,1] ~ predicho), col="green", lwd=2)

29

Page 30: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## ¿Cuánto explican los modelos?## consultad: https://jonlefcheck.net/2013/03/13/r2-for-linear-mixed-effects-models/comment-page-1/## http://onlinelibrary.wiley.com/doi/10.1111/j.2041-210x.2012.00261.x/epdf## http://onlinelibrary.wiley.com/doi/10.1111/2041-210X.12225/epdf## R2m: marginal R2 (proporción de la varianza explicada por los efectos fijos)## R2c: conditional R2 (proporción de la varianza explicada por todos los efectos## (los fijos y los aleatorios)## para el modelo de interés “random intercepts and slopes”r.squaredGLMM(modelo)

R2m R2c0.1783904 0.2168988

## para el modelo “random intercepts”r.squaredGLMM(m1)

R2m R2c0.1780067 0.1780067

## En el modelo m0 (Intraclass correlation: the "unconditional means model" or "null model")

r.squaredGLMM(m0) R2m R2c

0.0000000 0.0007702## En el modelo nulo R2c cuantifica las diferencias entre grupos (niveles del factor aleatorio)## sólo tiene sentido trabajar con diferencias entre niveles del factor aleatorio (modelo mixto) ## cuando existe una magnitud relevante de la varianza atribuible a ese efecto; incluso bajos niveles de## intraclass correlation (e.g., 15% to 20%) sugieren la necesidad de efectuar un modelo mixto

## No obstante, en este caso continuamos con el modelo mixto para poder trabajar ## con toda la variabilidad original, evitando la pseudorreplicación 30

Page 31: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

Método REML (restricted estimation maximum likelihood) vs MLEl método REML produce estimas menos sesgadas de los parámetros de la varianza que el método ML. Por tanto, es REML es el más indicado para llevar a cabo nuestros modelosmixtos, y por ello es el método implementado por defecto en los modelos lmer (i.e., no hace falta incluir como argumento REML=TRUE).e.g., página 22 (apartado 2.2) en https://socserv.socsci.mcmaster.ca/jfox/Books/Companion/appendix/Appendix‐Mixed‐Models.pdf

A la hora de comparar diferentes modelos anidados, que comparten la misma variable respuesta y las mismas unidades muestrales, el método REML lo podremos utilizar si, y sólo si, se mantienen constantes los efectos fijos (sean factores o covariantes) y cambia la estructura de los efectos aleatorios.

Pero NUNCA deberemos utilizar el método REML si en los modelos anidados que se comparan cambian los predictores fijos. En esta circunstancia deberemos cambiar la estructura de nuestro modelo lmer(…, REML=TRUE) a  ML con lmer(…, REML=FALSE).

Es más, podremos comparar modelos lmer con modelos lm, pero sólo usando la opción ML en lmer.

31

Page 32: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

Método REML (restricted estimation maximum likelihood) vs MLEsto es aplicable al utilizar comparaciones tipo lrtest y AIC(c).

Por tanto, antes de usar esos comandos de comparación de modelos, deberemos rehacer nuestros modelos de interés usando REML=FALSE. Para ello usaremos update(…).

m0.ml <- update(m0, REML=FALSE)m1.ml <- update(m1, REML=FALSE)modelo.ml <- update(modelo, REML=FALSE)

Ahora ya sí que podemos comparar modelos con lrtest o AICc, pero usando las versiones ML en vez de las versiones originales REML, aunque sean estas últimas más adecuadas para parametrizar los modelos.

32

Page 33: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Omnibus test de la “significación” global del modelo## Podemos comenzar con una aproximación basada en “información” usando AICc## Para ello comparamos los valores de AICc del modelo de interés y el nulo.## Por modelo “nulo” entendemos aquel que sólo incluye el factor aleatorio.## También podemos incluir en la comparación el de “random intercepts” (m1).## A menor valor AICc del modelo, el modelo es más informativo y parsimonioso

AICc(modelo.ML, m1.ML, m0.ML) Weights(AICc(modelo.ML, m1.ML, m0.ML))df AICc [1] 3.691836e-01 6.308164e-01 5.730539e-13

modelo.ML 15 1555.265 en valores de pesos relativos (que suman UNO)m1.ML 5 1554.193m0.ML 3 1609.647

## ¿cuántas veces es mejor un modelo que otro?## las comparaciones relevantes podrían ser (colocando primero el modelo con menor AICc):exp(-0.5*(AICc(modelo.ML)-AICc(m0.ML)))[1] 644238900641 es mucho mejor el de interés que el nulo

exp(-0.5*(AICc(m1.ML)-AICc(modelo.ML)))[1] 1.708679 es (ca. 2 veces) mejor el de “random intercepts” que el de “random intercepts and slopes”

o sea, el modelo mixto más sencillo ES SIMILAR al más complejo

33

Page 34: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Omnibus test de la “significación” global del modelo## Utilizamos la aproximación de los “likelihood ratio tests” (lrtest)## https://en.wikipedia.org/wiki/Likelihood-ratio_test## Se comparan modelos anidados, como son modelo, m1 y m0## ponemos antes el modelo más sencillo (i.e., menos grados de libertad, Df)

lrtest(m0.ML, modelo.ML) ## este es el omnibus testLikelihood ratio testModel 1: ln_uso10h ~ 1 + (1 | individuo)Model 2: ln_uso10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo)#Df LogLik Df Chisq Pr(>Chisq)

1 3 -801.79 2 14 -763.06 11 77.469 4.543e-12 *** es mucho mejor el de interés que el nulo

lrtest(m1.ML, modelo.ML)Likelihood ratio testModel 1: ln_uso10h ~ temperatura + distancia + spp + (1 | individuo)Model 2: ln_uso10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo)#Df LogLik Df Chisq Pr(>Chisq) 1 5 -772.02 2 14 -763.06 9 17.919 0.03613 * NO es MUCHO mejor el de “random intercepts” que el “random intercepts and slopes”

el modelo m1 es también mucho mejor que el “nulo” m0 (p << 0.001)

¡¡ deberíamos tener en cuenta otros criterios para elegir entre modelo y m1 !!34

Page 35: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Omnibus test de la “significación” global del modelo## Aproximación basada en métodos de remuestreo para comparar modelos anidados.## ponemos antes el modelo más complejo y luego el más sencillo## con nsim definimos el número de procesos de bootstrapping## con seed podemos cambiar los procesos de aleatorización-remuestreo## esta aproximación es más conveniente si sospechamos que nuestros modelos se## desvían de los supuestos canónicos de los modelos generales lineales## deberíamos de utilizar ML en vez de REML en modelo vs m0, ya que tienen diferentes efectos fijos

PBmodcomp(modelo.ML, m0.ML, nsim=1000, seed=123) ## este es el omnibus testParametric bootstrap test; time: 293.89 sec; samples: 1000 extremes: 0;large : ln_uso10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo)small : ln_uso10h ~ 1 + (1 | individuo)

stat df p.valueLRT 77.469 11 4.543e-12 ***PBtest 77.469 0.000999 *** es mucho mejor el de interés que el nulo

PBmodcomp(modelo.ML, m1.ML, nsim=1000, seed=123)Parametric bootstrap test; time: 294.69 sec; samples: 1000 extremes: 363;Requested samples: 1000 Used samples: 917 Extremes: 363large : ln_uso10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo)small : ln_uso10h ~ temperatura + distancia + spp + (1 | individuo)

stat df p.valueLRT 1.8942 5 0.8636PBtest 1.8942 0.3693 NO es mejor el de “random intercepts” que el de “random intercepts and slopes”

el modelo m1 es también mucho mejor que el “nulo” m0 (p << 0.001) 35

Page 36: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## RESUMEN DEL MODELO## lo siguiente es lo mismo que summary(modelo, ddf="Satterthwaite")## sobre todo nos fijaremos en los coeficientes de los "Fixed effects"## también es muy interesante la matriz "Correlation of Fixed Effects“ para valorar## la dependencia-independencia entre los efectos fijos (deberíamos ver valores 0)

summary(modelo)...

Fixed effects:Estimate Std. Error df t value Pr(>|t|)

(Intercept) -0.47998 0.57008 42.96000 -0.842 0.40447 temperatura 0.33614 0.09319 39.47000 3.607 0.00086 ***distancia1 0.72993 0.09594 120.88000 7.608 6.73e-12 ***spp1 0.48722 0.20938 61.64000 2.327 0.02327 * spp2 -0.18926 0.22504 61.64000 -0.841 0.40359 spp3 -0.54974 0.16849 61.64000 -3.263 0.00180 ** spp4 -0.01695 0.20938 61.64000 -0.081 0.93574 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:(Intr) tmprtr dstnc1 spp1 spp2 spp3

temperatura -0.984 distancia1 -0.163 0.136 spp1 0.012 0.000 0.000 spp2 0.029 0.000 0.000 -0.320 spp3 -0.038 0.000 0.000 -0.217 -0.262 spp4 0.012 0.000 0.000 -0.292 -0.320 -0.217 36

Page 37: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## RESUMEN DEL MODELO## para la aproximación de Kenward-Roger se añade ddf="Kenward-Roger"## creamos un objeto con los resultados del modelo, para no tenerlo que hacer cada vez:

resumen.modelo.kr <- summary(modelo, ddf="Kenward-Roger")

## para ver qué contienenames(resumen.modelo.kr)

## la aproximación de Kenward-Roger es mucho más severa en los grados de libertad## comparadlo con la salida previa usando Satterthwaite

Fixed effects:Estimate Std. Error df t value Pr(>|t|)

(Intercept) -0.47998 0.57008 38.90000 -0.842 0.405032 temperatura 0.33614 0.09319 38.39000 3.607 0.000881 ***distancia1 0.72993 0.09594 38.39000 7.608 3.52e-09 ***spp1 0.48722 0.20938 33.00000 2.198 0.035107 * spp2 -0.18926 0.22504 33.00000 -0.794 0.432723 spp3 -0.54974 0.16849 33.00000 -3.081 0.004139 ** spp4 -0.01695 0.20938 33.00000 -0.076 0.939521

37

Page 38: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## obtención de coeficientes estandarizados## proporciona los coeficientes beta (β) de regresión que son comparables entre efectos## el comando estandariza los coeficientes de regresión a media cero y sd=1/2, ## en vez de la estandarización clásica de "a media cero y sd=1"

modelo.std <- standardize(modelo)

## coeficientes de regresión standarizados para la parte fija## comparando sus valores (absolutos) podemos alcanzar una idea de qué efectos son## más importantes en nuestro modelo

fixef(modelo.std)

(Intercept) z.temperatura c.distancia spp1 spp2 spp3 spp4 1.70638775 0.78362501 -1.45986027 0.50649776 -0.18946142 -0.53730659 -0.04545901

## coeficientes de regresión standarizados para la parte aleatoria

ranef(modelo.std)

## sale una larguísima lista que no muestro

38

Page 39: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## valores de Chi2 y sus p-values para los EFECTOS ALEATORIOSrand(modelo)

Analysis of Random effects Table:Chi.sq Chi.DF p.value

temperatura:individuo 2.0824 3 0.6distancia:individuo 0.0757 3 1.0

## tabla de ANOVA con significación de EFECTOS FIJOS## Con el comando Anova{car} se obtienen directamente los resultados de## significación usando la aproximación Kenward-Roger## ESTA ES LA OPCIÓN QUE DEBEREMOS UTILIZAR PARA EXAMINAR LA SIGNIFICACIÓN DE EFECTOS## CUANDO HEMOS APLICADO TABLAS DE CONTRASTES ESPECIFICADAS A PRIORI POR EL INVESTIGADOR## que serán incluidas dentro de lmer(...) con el argumento contrasts; ejemplo:## contrasts=list(distancia=contr.sum, spp=contr.sum)

Anova(modelo, type=3, test="F")Analysis of Deviance Table (Type III Wald F tests with Kenward-Roger df)Response: ln_uso10h

F Df Df.res Pr(>F) (Intercept) 0.7087 1 38.900 0.4050321 temperatura 13.0104 1 38.393 0.0008808 ***distancia 57.8797 1 38.393 3.519e-09 ***spp 3.6690 4 33.000 0.0140407 *

39

Page 40: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## tabla de ANOVA con significación de EFECTOS FIJOS## significaciones de los Fixed Effects usando la aproximación Kenward-Roger## proporciona la Sum Sq de los efectos fijos## los DenDf son los mismos que los obtenidos en df de summary## los valores de p y d.f. son idénticos a los obtenidos en summary## da lo mismo que: Anova(modelo, type=3, test="F")## el comando anova aplicado a objetos merMod (anova.merModLmerTest)## no equivalente a la usada en objetos lm o glm; equivalente a Anova{car}## podemos usar tipos de SS: I-1, II-2 y III-3 en el argumento type=## consultad:## http://web.warwick.ac.uk/statsdept/useR-2011/abstracts/290311-halekohulrich.pdf

anova(modelo, ddf="Kenward-Roger", type=3)

Analysis of Variance Table of type III with Kenward-Roger approximation for degrees of freedom

Sum Sq Mean Sq NumDF DenDF F.value Pr(>F) temperatura 41.294 41.294 1 38.393 13.010 0.0008808 ***distancia 183.705 183.705 1 38.393 57.880 3.519e-09 ***spp 46.580 11.645 4 33.000 3.669 0.0140409 * ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

40

Page 41: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## tabla de ANOVA con significación de EFECTOS FIJOS## significaciones de los Fixed Effects usando la aproximación Satterthwaite

anova(modelo, ddf="Satterthwaite", type=3)

Analysis of Variance Table of type III with Satterthwaite approximation for degrees of freedom

Sum Sq Mean Sq NumDF DenDF F.value Pr(>F) temperatura 41.294 41.294 1 39.465 13.010 0.0008602 ***distancia 183.705 183.705 1 120.883 57.880 6.729e-12 ***spp 52.226 13.056 4 61.643 4.114 0.0051009 ** ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

## contrastad esta tabla con la anterior y ved cómo los DenDF son más relajados

En el caso de modelos mixtos muy complejos, con muchas interacciones entre factores fijos, podríamos optarpor una aproximación de Tipo‐II en Anova y anova (type=2).* Primero se estiman los efectos simples principales (su estima de significación no es afectada por las interacciones.* Luego se estiman las interacciones dobles, controlando los efectos simples.* Luego las interacciones triples, controlando por las dobles y los efectos simples.* Etc ...

41

Page 42: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:## TABLA SINTÉTICA DE LOS RESULTADOS CON LA PARTICIÓN DE LA VARIANZA## utilizando la estima de grados de libertad de Kenward-Roger## incluimos las SS de los efectos fijos, sus magnitudes (eta2 y partialeta2)## los grados de libertad, las F y p.## consultad: https://en.wikipedia.org/wiki/Effect_size## http://jalt.org/test/PDF/Brown28.pdf

SStotal <- sum((modelo@frame[,1]-mean(modelo@frame[,1]))^2)SSerror <- SStotal*(1-as.numeric(r.squaredGLMM(modelo)[2]))tabla.SS <- as.data.frame(anova(modelo, ddf="Kenward-Roger", type=3))eta2 <- tabla.SS[,1]/Sstotaltabla.SS <- data.frame(eta2, tabla.SS)print(tabla.SS, digits=4)

> print(tabla.SS, digits=4)eta2 Sum.Sq Mean.Sq NumDF DenDF F.value Pr..F.

temperatura 0.02728 41.29 41.29 1 38.39 13.010 8.808e-04distancia 0.12137 183.71 183.71 1 38.39 57.880 3.519e-09spp 0.03077 46.58 11.65 4 33.00 3.669 1.404e-02

42

Page 43: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## Using simulation to represent uncertainty in regression coefficients.## Instead of using the standard errors and intervals obtained from the model, ## we compute uncertainties by simulation.## We can use these to calculate confidence intervals for coefficients that do not## have standard errors in the model output.

sim.modelo <- sim(modelo, n.sims=1000)

## coeficientes de los efectos fijos; es lo mismo que da:## summary(modelo) en Fixed effects## la sd de describe(fixef(sim.modelo)) se corresponde con el error estándard## de la estima de los coeficientes al efectuar simulaciones por remuestreo## efectúo una selección de las columnas usando describe(fixef(sim.modelo))

tabla.mixedmodel.simulada <- describe(fixef(sim.modelo))[,c(1:4,11:12)]colnames(tabla.mixedmodel.simulada)[4] <- "Std. Error"print(tabla.mixedmodel.simulada, digits=5)

43

Page 44: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## Se proporcionan los valores para los coeficientes del modelo## Resultados que compararemos con los que salen en summary(modelo)## cuanta mayor diferencia haya entre estos resultados y los de summary(modelo)## más influencia hay de puntos influyentes y perdidos en nuestros resultados## los valores mean se refieren a la media de los coeficientes de regresión

> print(tabla.mixedmodel.simulada, digits=5)vars n mean Std. Error skew kurtosis

(Intercept) 1 1000 -0.50296 0.57163 -0.02879 -0.13386temperatura 2 1000 0.33978 0.09347 0.00800 -0.18364distancia1 3 1000 0.72888 0.09642 0.01252 -0.03175spp1 4 1000 0.47962 0.21190 0.06920 -0.19827spp2 5 1000 -0.18930 0.22887 0.00278 -0.14366spp3 6 1000 -0.54842 0.16844 0.04132 -0.15019spp4 7 1000 -0.01609 0.20251 0.01737 -0.13875

Podríamos recalcular la t de Student dividiendo los valores medios (mean) por el se (Std. Error).Considerando los grados de libertad (df) que se obtienen de las tablas summary(modelo) con las aproximaciones de Satterthwaite o Kenward‐Roger podríamos calcular las p para cada coeficiente.

Para distancia1:  0.7289/0.0964 = 7.5612 para   df = 38.39> 2*pt(7.5612, df=38.39, lower.tail=FALSE) ## p para Student-t con dos colas[1] 4.336482e-09

44

Page 45: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## También podemos efectuar parametrizaciones de nuestro modelo mixto utilizando## procedimientos de remuestreo (bootstrapping), que también serán de utilidad ## para obtener, de otro modo, estimas de significación. Se obtienen los coeficientes.## Es conveniente aplicarlo cuando nuestro modelo no proporciona significaciones y## cuando ha habido desvíos de los supuestos canónicos de los residuos del modelo.

## para Model-based (Semi-)Parametric Bootstrap for Mixed Models## type= puede ser "parametric" ó "semiparametric“; nsim: número de simulaciones## confidence intervals with finite-size corrections (important when the number of groups is <50)

## podemos efectuar diferentes simulaciones cambiando el valor seed

mcmc.fixed <- bootMer(modelo, FUN=fixef, nsim=1000, type="parametric", seed=1)coef.mcmc.fixed <- as.data.frame(mcmc.fixed$t)tabla <- describe(coef.mcmc.fixed)[,c(1:4,11:12)]colnames(tabla)[4] <- "Std.Error"tabla$t_Student <- tabla$mean / tabla$Std.Errorddf.fijos <- Anova(modelo, type=3, test="F")$Df.restabla$p_boot <- round(2*pt(-abs(tabla$t_Student), df=ddf.fijos), 5)tabla$coeficiente.modelo <- round(fixef(modelo), 5)

## comparar los coeficientes con los originales del modelo (a la deracha de la tabla)## para hacer uso de las p's derivadas de las t_Student (t_Student=mean/Std.Error; p_boot) ## los valores de kurtosis y sesgo deberían ser cercanos a ceroprint(tabla, digits=5) 45

Page 46: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto

> print(tabla, digits=5)vars n mean Std.Error skew kurtosis t_Student p_boot coeficiente.modelo

(Intercept) 1 1000 -0.50887 0.55331 -0.00334 0.24341 -0.91969 0.35796 -0.47998temperatura 2 1000 0.34080 0.09129 -0.01936 0.24488 3.73315 0.00020 0.33614distancia1 3 1000 0.73094 0.09862 -0.03419 -0.25838 7.41186 0.00000 0.72993spp1 4 1000 0.47625 0.21168 -0.16705 0.16584 2.24987 0.02467 0.48722spp2 5 1000 -0.19187 0.22739 -0.05612 0.15190 -0.84382 0.39897 -0.18926spp3 6 1000 -0.55345 0.16665 0.05936 0.13751 -3.32090 0.00093 -0.54974spp4 7 1000 -0.00694 0.21585 -0.11718 0.00637 -0.03216 0.97435 -0.01695

## Cuanto más cambien los coeficientes entre los resultados originales y los## obtenidos mediante bootstrapping, más importancia tienen en nuestros## datos los puntos influyentes y/o perdidos, y otros desvíos de los## supuestos canónicos de los modelos (e.g., heterocedasticidad)## Los sesgos y las kurtosis de los coeficientes simulados deberían estar## próximos a “cero”. De ese modo podríamos efectuar estimas paramétricas## de significación, usando t_Student = mean/Std.Error y p_boot.

46

Page 47: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## Si los valores de sesgo y kurtosis de la tabla tabla se desvían considerablemente ## de cero, entonces es mejor usar el método de los percentiles para estimar## la significación de los coeficientes.

## Seleccionemos una variable para ver sus intervalos de confianza con diferentes percentiles## vemos los órdenes de los predictores y su número lo introducimos aquí abajo (van: [1], [2], [3], ...)names(coef.mcmc.fixed)que.variable <- 3

## si el rango de valores 2.5% - 97.5% incluye el valor cero ## (ó 2.5% es negativo y 97.5% es positivo) ## entonces no es significativo a p=0.05

print(c(colnames(coef.mcmc.fixed[que.variable]), round(quantile(coef.mcmc.fixed[,que.variable],c(0.0005, 0.005, 0.025, 0.05, 0.1, 0.9, 0.95, 0.975, 0.995, 0.9995)),5)), quote=FALSE)

0.05% 0.5% 2.5% 5% 10% 90% 95% 97.5% 99.5% 99.95%distancia1 0.40006 0.47478 0.53907 0.56575 0.59799 0.85561 0.89323 0.92179 0.95711 0.98701

## Aquí arriba se ven los límites a p=0.05 y p=0.01

47

Page 48: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## Otro modo es utilizando el comando confint.merMod## podemos cambiar level=0.99 para p=0.01## Que los intervalos no incluyan el valor “cero”

confint.fixed <- confint.merMod(modelo, parm="beta_", level=0.95, method="boot", boot.type="perc", nsim=1000)

print(confint.fixed, digits=3)

2.5 % 97.5 %(Intercept) -1.6053 0.786temperatura 0.1323 0.521distancia1 0.5496 0.914spp1 0.0504 0.921spp2 -0.6509 0.257spp3 -0.9095 -0.220spp4 -0.4533 0.396

48

Page 49: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Simulaciones de un modelo mixto## También podemos utilizar los resultados de las simulaciones para estimar## las correlaciones existentes entre los coeficientes de regresión del modelo## Deberían ser similares a las obtenidas en el resumen del modelo,## al final de la salida summary(modelo): Correlation of Fixed Effects.print(cor(coef.mcmc.fixed), digits=3)

(Intercept) temperatura distancia1 spp1 spp2 spp3 spp4(Intercept) 1.0000 -0.9822 -0.1700 -0.0013 0.013 -0.0640 0.0155temperatura -0.9822 1.0000 0.1372 0.0142 0.021 0.0221 0.0031distancia1 -0.1700 0.1372 1.0000 0.0432 -0.038 -0.0087 -0.0608spp1 -0.0013 0.0142 0.0432 1.0000 -0.322 -0.1811 -0.2949spp2 0.0134 0.0209 -0.0378 -0.3217 1.000 -0.2573 -0.3483spp3 -0.0640 0.0221 -0.0087 -0.1811 -0.257 1.0000 -0.1990spp4 0.0155 0.0031 -0.0608 -0.2949 -0.348 -0.1990 1.0000

summary(modelo)...Correlation of Fixed Effects:

(Intr) tmprtr dstnc1 spp1 spp2 spp3 temperatura -0.984 distancia1 -0.163 0.136 spp1 0.012 0.000 0.000 spp2 0.029 0.000 0.000 -0.320 spp3 -0.038 0.000 0.000 -0.217 -0.262 spp4 0.012 0.000 0.000 -0.292 -0.320 -0.217 49

Page 50: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Visualización de efectos de los factores## para inspeccionar los efectos de las predictoras nominales## si hay predictoras continuas se presentan los valores medios+se## controlando por esas covariantesplot(interactionMeans(modelo, legend.margin=0.2))

50

Page 51: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Visualización de efectos de los factores## si en vez del modelo sin interacciones, las hubiésemos incluido:modelo.int <- lmer(ln_uso10h ~temperatura+distancia+spp+distancia:spp+

(temperatura|individuo)+(distancia|individuo), data=datos, REML=TRUE)## entonces se cuantificarían las diferencias cruzadas entre factoresplot(interactionMeans(modelo.int, legend.margin=0.2))

51

> Anova(modelo.int, type=3, test="F")Analysis of Deviance Table (Type III Wald F tests with Kenward-Roger df)

Response: ln_uso10hF Df Df.res Pr(>F)

(Intercept) 0.7590 1 38.894 0.3889845 temperatura 12.8789 1 38.223 0.0009317 ***distancia 72.4212 1 34.112 5.958e-10 ***spp 4.3605 4 33.000 0.0061074 ** distancia:spp 4.6132 4 33.000 0.0045415 **

> AICc(modelo, modelo.int)df AICc

modelo 14 1570.584modelo.int 18 1567.897

> exp(-0.5*(AICc(modelo.int)-AICc(modelo)))[1] 3.831971

Page 52: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando lmer.Ejemplo con resultados:

## Problemas en las estimas

## trabajando con nuestro modelo de interés “random intercept and slopes”## en repetidas ocasiones nos han aparecido mensajes de alerta como:## lecturas recomendada acerca de las causas:## http://www.theanalysisfactor.com/wacky-hessian-matrix/ ## http://www2.gsu.edu/~mkteer/npdmatri.html

Warning messages:1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :

unable to evaluate scaled gradient2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, :

Model failed to converge: degenerate Hessian with 1 negative eigenvalues

## En estas circunstancias es conveniente no hacer uso de las estimas## exactas de significación que salen de Anova(...) ó anova(...)## Debemos valorar la conveniencia de re-escalar las variables predictoras## para que muestren unos rangos de variación similares (zeta-standarización)## Podemos simplificar el modelo (por ejemplo, eliminando “random slopes”)## y/o utilizar las aproximaciones de bootstrapping (semi-)pamétrico,## comprobando también que los valores de Correlation of Fixed Effects## sean lo más cercanos a “cero”

## podemos repetir todo lo anterior haciendo que nuestro modelo de interés sea m1modelo <- m1 52

Page 53: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados: contamos con el comando glmer## cargamos tablas de contrastes compartidas con las de otros programas estadísticos (como SPSS, STATISTICA)

options(contrasts=c(factor="contr.sum", ordered="contr.poly"))

## construimos nuestros modelos de interés## asumimos una distribución poisson para la respuesta## efectúa la estima usando Maximum Likelihood (ML, aproximación de Laplace)## por tanto, no nos preocuparemos por lo expuesto en las páginas 31-32.

## si plantean problemas podemos cambiar el valor nAGQ a un valor más alto## nAGQ sólo puede tomar el valor 1 en modelos con más de un efecto aleatorio## si hay problemas en la estimas, podemos incluir un control de errores## dentro de glmer(..., control=mi.control)mi.control <- glmerControl(check.conv.grad=.makeCC(action ="ignore", tol=1e-6, relTol=NULL),

optimizer="bobyqa", optCtrl=list(maxfun=100000))

## modelo es "random intercept and slope"## modelo2 es "random intercept, constant slope"## m0 es el modelo nulo ("unconditional means model")

modelo <- glmer(entradas10h ~ temperatura+distancia+spp +(temperatura|individuo)+(distancia|individuo)+(1|spp:individuo), family=poisson, data=datos, nAGQ=1)

modelo2 <- glmer(entradas10h ~ temperatura+distancia+spp +(1|individuo), family=poisson, data=datos, nAGQ=25)

m0 <- glmer(entradas10h ~ 1 +(1|individuo), family=poisson, data=datos, nAGQ=25) 53

Page 54: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

54

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados

## exploramos los residuos del modelo, con los residuos de devianza## aquí, como ejemplo, con modelo

residuos <- residuals(modelo, type="deviance")hist(residuos, density=5, freq=FALSE, main="residuos de devianza", ylim=c(0,0.70))curve(dnorm(x, mean=mean(residuos), sd=sd(residuos)), col="red", lwd=2, add=TRUE, yaxt="n")

qqnorm(residuos, main="residuos de devianza")qqline(residuos, col="red", lwd=2)qqmath(modelo, id=0.01, main="1% de residuos extremos")

## Exploración visual de la heterocedasticidad de los residuosplot(log(fitted(modelo)), residuos, ylab="residuos de devianza", main="¿HAY HETEROCEDASTICIDAD?")abline(h=0, col="red", lwd=2)

## otra posibilidad sintética es:mcp.fnc(modelo)

## valores observados y predichos en la escala original de medidapredicho <- fitted(modelo)plot(modelo@frame[,1]~ predicho, ylab="RESPUESTA", xlab="PREDICCIONES")abline(lm(modelo@frame[,1]~ predicho), col="green", lwd=2)

Page 55: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

55

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizadosResiduos del modelo, con los residuos de devianza

Page 56: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

56

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizadosResiduos del modelo, con los residuos de devianza

Page 57: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

57

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizadosResiduos del modelo, con los residuos de devianza

comando mcp.fnc(modelo)

Page 58: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Omnibus test de la “significación” global del modelo## Aproximación basada en “información” usando AICc## Para ello comparamos los valores de AICc del modelo de interés y el nulo.## Por modelo “nulo” entendemos aquel que sólo incluye el factor aleatorio.## También podemos incluir en la comparación el de “random intercepts”.## A menor valor AICc del modelo, el modelo es más informativo y parsimonioso

AICc(modelo, modelo2, m0)df AICc

modelo 14 728.9201modelo2 8 736.8608m0 2 813.1498

## ¿cuántas veces es mejor un modelo que otro?## las comparaciones relevantes podrían ser (colocando primero el modelo con menor AICc):exp(-0.5*(AICc(modelo)-AICc(m0)))[1] 1.950987e+18 es mucho mejor el de interés que el nulo

exp(-0.5*(AICc(modelo)-AICc(modelo2)))[1] 53.00481 es algo mejor el de “random intercepts and slopes” que el de “random intercepts”

el modelo modelo2 es también mucho mejor que el “nulo” m0 (3.680774e+16 veces mejor)

58

Page 59: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Omnibus test de la “significación” global del modelo## Utilizamos la aproximación de los “likelihood ratio tests” (lrtest)## Se comparan modelos anidados, como son modelo, modelo2 y m0## ponemos antes el modelo más sencillo (i.e., menos grados de libertad, Df)

lrtest(m0, modelo) ## este es el omnibus testLikelihood ratio testModel 1: entradas10h ~ 1 + (1 | individuo)Model 2: entradas10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo) + (1 | spp:individuo)#Df LogLik Df Chisq Pr(>Chisq)

1 2 -404.56 2 14 -349.88 12 109.35 < 2.2e-16 *** es mucho mejor el de interés que el nulo

lrtest(modelo2, modelo)Likelihood ratio testModel 1: entradas10h ~ temperatura + distancia + spp + (1 | individuo)Model 2: entradas10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo) + (1 | spp:individuo)#Df LogLik Df Chisq Pr(>Chisq)

1 8 -360.24 2 14 -349.88 6 20.703 0.002074 ** es mejor el de “random intercepts and slopes” que el de “random intercepts”

el modelo modelo2 es también mucho mejor que el “nulo” m0 (p << 0.001)

59

Page 60: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Devianza explicada

## en los modelos generalizados mixtos no siempre es posible utilizarr.squaredGLMM(modelo)## especialmente en el caso de los modelos que operan con distribuciones Poisson

## tendremos que recurrir a una estima de devianza explicada (pseudoR2) utilizando## los valores de log_Likelihhod del modelo de interés (modelo) y del nulo (m0)## esta devianza explicada SÓLO hace referencia a la parte fija del modelo, respecto## a lo no explicado por la parte aleatoria

logLik(modelo)> logLik(modelo)'log Lik.' -349.8847 (df=14)logLik(m0)> logLik(m0)'log Lik.' -404.559 (df=2)

## aquí calculamos la diferencia y cociente de devianzaspseudoR2 <- as.vector((logLik(m0)- logLik(modelo))/ logLik(m0))

print(c("Devianza explicada (%) =", round(pseudoR2*100, 2)), quote=FALSE)[1] Devianza explicada (%) = 13.51

60

Page 61: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Resultados del modelo## resumen del modelo, que proporciona los coefcientes de regresiónsummary(modelo)

Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod']Family: poisson ( log )Formula: entradas10h ~ temperatura + distancia + spp + (temperatura | individuo) + (distancia | individuo) + (1 | spp:individuo). . . más información aquí que no presento . . .

Fixed effects:Estimate Std. Error z value Pr(>|z|)

(Intercept) -2.69656 0.61788 -4.364 1.28e-05 ***temperatura 0.22343 0.09443 2.366 0.01798 * distancia1 0.92211 0.20355 4.530 5.90e-06 ***spp1 0.31672 0.15813 2.003 0.04518 * spp2 0.11969 0.19094 0.627 0.53075 spp3 -0.42741 0.16488 -2.592 0.00953 ** spp4 0.11458 0.17921 0.639 0.52261 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:(Intr) tmprtr dstnc1 spp1 spp2 spp3

temperatura -0.951 distancia1 -0.325 0.061 spp1 -0.057 0.044 0.051 spp2 -0.060 0.050 0.141 -0.201 spp3 -0.030 0.006 0.111 -0.168 -0.149 spp4 -0.053 0.028 0.156 -0.179 -0.131 -0.119 61

glmer no muestralos grados de libertad para los

términos error de los factores fijos

los coeficientes de correlaciónentre los coeficientes del modelo

deberían dar valores  0

Page 62: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## obtención de coeficientes estandarizados## proporciona los coeficientes beta (β) de regresión que son comparables entre efectos## estandariza los coeficientes de regresión a media cero y sd=1/2,## en vez de la estandarización clásica de "a media cero y sd=1"

modelo.std <- standardize(modelo)

## coeficientes de regresión standarizados para la parte fija## comparando sus valores (absolutos) podemos alcanzar una idea de qué efectos son## más importantes en nuestro modelo

fixef(modelo.std)

(Intercept) z.temperatura c.distancia spp1 spp2 spp3 spp4 -1.1520292 0.5378475 -1.8338954 0.3193191 0.1241970 -0.4253936 0.1122536

62

Page 63: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Resultados del modelo## exploramos la significación de los efectos fijos## en esta ocasión no se proporcionan los grados de libertad para el término error## ambas líneas de código dan resultados similares (más conveniente la segunda)

Anova(modelo, type=3, test="Chisq")Analysis of Deviance Table (Type III Wald chisquare tests)Response: entradas10h

Chisq Df Pr(>Chisq) (Intercept) 19.0463 1 1.276e-05 ***temperatura 5.5977 1 0.01798 * distancia 20.5213 1 5.897e-06 ***spp 10.3162 4 0.03543 * ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

drop1(modelo, ~., test="Chisq")Single term deletionsModel:entradas10h ~ temperatura + distancia + spp + (temperatura |

individuo) + (distancia | individuo) + (1 | spp:individuo)Df AIC LRT Pr(Chi)

<none> 727.77 temperatura 1 730.57 4.799 0.02848 * distancia 1 758.79 33.025 9.099e-09 ***spp 4 729.19 9.422 0.05138 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

63

drop1 compara modelosel saturado (sin quitar efectos <none>)

con modelos que cada vez quitanel efecto que se quiere examinar

Anova efectúa una estimasimultánea (i.e., parcial)

utilizando el estadístico de Wald(se considera el test de Wald impreciso)

Page 64: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Resultados del modelo## Simulaciones del modelo mixto generalizado poisson## Using simulation to represent uncertainty in regression coefficients.## Resultados que compararemos con los que salen en summary(modelo)## cuanta mayor diferencia haya entre estos resultados y los de summary(modelo)## más influencia hay de puntos influyentes y perdidos en nuestros resultados## los valores mean se refieren a la media de los coeficientes de regresión## Los sesgos y las kurtosis de los coeficientes simulados deberían tomar valores## próximos a “cero” si quisiésemos usar métodos paramétricos para estimar p.## De ese modo podríamos efectuar estimas paramétricas de significación mediante:## Zeta = mean / Std.Error

sim.modelo <- sim(modelo, n.sims=1000)

tabla.mixedmodel.simulada <- describe(fixef(sim.modelo))[,c(1:4,11:12)]colnames(tabla.mixedmodel.simulada)[4] <- "Std. Error"print(tabla.mixedmodel.simulada, digits=5)

vars n mean Std. Error skew kurtosis(Intercept) 1 1000 -2.70879 0.56479 -0.03723 -0.08290temperatura 2 1000 0.22522 0.08787 0.02970 -0.04770distancia1 3 1000 0.92171 0.15749 -0.01434 -0.11314spp1 4 1000 0.31525 0.16570 0.05463 0.11053spp2 5 1000 0.12211 0.17947 -0.10184 -0.07399spp3 6 1000 -0.43077 0.16654 -0.02342 -0.40285spp4 7 1000 0.11538 0.16658 -0.15095 -0.08182

64

Page 65: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Simulaciones de un modelo mixto## También podemos efectuar parametrizaciones de nuestro modelo mixto utilizando## procedimientos de remuestreo (bootstrapping), que también serán de utilidad ## para obtener, de otro modo, estimas de significación. Se obtienen los coeficientes.## Es conveniente aplicarlo cuando nuestro modelo no proporciona significaciones y## cuando ha habido desvíos de los supuestos canónicos de los residuos del modelo.

## Para Model-based (Semi-)Parametric Bootstrap for Mixed Models## type= puede ser "parametric" ó "semiparametric“; nsim: número de simulaciones## confidence intervals with finite-size corrections (important when the number of groups is <50)

## podemos efectuar diferentes simulaciones cambiando el valor seed

## Este método es ¡¡muy lento!!

mcmc.fixed <- bootMer(modelo, FUN=fixef, nsim=100, type="parametric", seed=1)coef.mcmc.fixed <- as.data.frame(mcmc.fixed$t)tabla <- describe(coef.mcmc.fixed)[,c(1:4,11:12)]colnames(tabla)[4] <- "Std.Error"tabla$Zeta <- tabla$mean / tabla$Std.Errortabla$p_boot <- round(2*pnorm(abs(tabla$Zeta), lower.tail=FALSE), 5)tabla$coeficiente.modelo <- round(fixef(modelo), 5)

## comparar los coeficientes con los originales del modelo (a la deracha de la tabla)

print(tabla, digits=5)

65

Page 66: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Simulaciones de un modelo mixto

> print(tabla, digits=5)vars n mean Std.Error skew kurtosis Zeta p_boot coeficiente.modelo

(Intercept) 1 100 -2.71930 0.48217 0.62815 1.61915 -5.63969 0.00000 -2.69656temperatura 2 100 0.22315 0.07764 -0.67592 1.08381 2.87432 0.00405 0.22343distancia1 3 100 0.93034 0.18908 0.31368 -0.21535 4.92042 0.00000 0.92211spp1 4 100 0.32819 0.16180 0.12346 -0.40956 2.02838 0.04252 0.31672spp2 5 100 0.12421 0.18578 -0.30082 0.65160 0.66856 0.50377 0.11969spp3 6 100 -0.43521 0.15207 -0.07196 -0.26082 -2.86201 0.00421 -0.42741spp4 7 100 0.10470 0.16114 -0.02056 0.69835 0.64976 0.51585 0.11458

## Cuanto más cambien los coeficientes y sus errores standard entre los## resultados originales y los obtenidos mediante bootstrapping,## más importancia tienen en nuestros datos los puntos influyentes y/o## perdidos, y otros desvíos de los supuestos canónicos de los modelos ## Los sesgos y las kurtosis de los coeficientes simulados deberían estar## próximos a “cero” si quisiésemos usar métodos paramétricos para estimar p## mediante Zeta = mean / Std.Error

66

Page 67: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Simulaciones de un modelo mixto## Si los valores de sesgo y kurtosis de la tabla tabla se desvían considerablemente## de cero, entonces es mejor usar el método de los percentiles para estimar ## la significación de los coeficientes.

## seleccionemos una variable para ver sus intervalos de confianza con diferentes percentiles## vemos los órdenes de los predictores y su número lo introducimos aquí abajo (van: [1], [2], [3], ...)names(coef.mcmc.fixed)que.variable <- 3

## si el rango de valores 2.5% - 97.5% incluye el valor cero ## (ó 2.5% es negativo y 97.5% es positivo) ## entonces no es significativo a p=0.05

print(c(colnames(coef.mcmc.fixed[que.variable]), round(quantile(coef.mcmc.fixed[,que.variable],c(0.025, 0.05, 0.1, 0.9, 0.95, 0.975)),5)), quote=FALSE)

2.5% 5% 10% 90% 95% 97.5% distancia1 0.60605 0.65982 0.68573 1.18664 1.2435 1.30063

## Aquí arriba se ven los límites a p=0.05 y p=0.1

67

Page 68: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Simulaciones de un modelo mixto## Otro modo es utilizando el comando confint.merMod## podemos cambiar level=0.99 para p=0.01## Este método es ¡¡muy lento!!## Que los intervalos no incluyan el valor “cero”

confint.fixed <- confint.merMod(modelo, parm="beta_", level=0.95, method="boot", boot.type="perc", nsim=100)

print(confint.fixed, digits=3)

2.5 % 97.5 %(Intercept) -3.8218 -2.0319temperatura 0.1066 0.3709distancia1 0.6497 1.3008spp1 0.0159 0.6938spp2 -0.3317 0.4692spp3 -0.8094 -0.0953spp4 -0.3561 0.4400

68

Page 69: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES MIXTOS DE EFECTOS “ENTRE” SUJETOSUtilicemos el paquete lme4 y su comando glmer.Ejemplo con resultados:

Modelos mixtos generalizados## Simulaciones de un modelo mixto## También podemos utilizar los resultados de las simulaciones para estimar## las correlaciones existentes entre los coeficientes de regresión del modelo## Deberían ser similares a las obtenidas en el resumen del modelo,## al final de la salida summary(modelo): Correlation of Fixed Effects.print(cor(coef.mcmc.fixed), digits=3)

(Intercept) temperatura distancia1 spp1 spp2 spp3 spp4(Intercept) 1.0000 -0.92320 -0.3160 0.0146 0.06642 -0.0327 -0.0186temperatura -0.9232 1.00000 -0.0167 -0.0770 -0.00607 0.0367 0.0530distancia1 -0.3160 -0.01673 1.0000 0.1988 -0.11792 -0.0860 0.0159spp1 0.0146 -0.07700 0.1988 1.0000 -0.37081 -0.2984 -0.1219spp2 0.0664 -0.00607 -0.1179 -0.3708 1.00000 -0.2577 -0.3622spp3 -0.0327 0.03672 -0.0860 -0.2984 -0.25767 1.0000 -0.2058spp4 -0.0186 0.05298 0.0159 -0.1219 -0.36215 -0.2058 1.0000

summary(modelo)...Correlation of Fixed Effects:

(Intr) tmprtr dstnc1 spp1 spp2 spp3 temperatura -0.951 distancia1 -0.325 0.061 spp1 -0.057 0.044 0.051 spp2 -0.060 0.050 0.141 -0.201 spp3 -0.030 0.006 0.111 -0.168 -0.149 spp4 -0.053 0.028 0.156 -0.179 -0.131 -0.119 69

Page 70: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOS

n way ANOVAScon factores bloque(diseños de BLOQUE)

70

Page 71: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn estos diseños se define al menos un factor "bloque" en el que se establecen las

muestras. Este factor "bloque" no es un objeto de interés para el investigador.Respecto al diseño "completamente aleatorizado", en el "diseño de bloques" las

unidades muestrales se reunen en bloques que son los niveles de un factor bloque.

71

Page 72: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesPara que estos diseños de bloques sean correctos, los niveles de otros factores de interés tienen que estar perfectamente representados, y de modo balanceado, en los niveles del factor "bloque"  (consultad http://www.tfrec.wsu.edu/anova/RCB.html)

Los bloques se definen para aleatorizar los efectos que no controlamos y son aleatorios.

Ejemplos de un factor BLOQUE y otro de interés FACTOR (con 4 niveles A, B, C, D)con una sola réplica por celda

72

BLOQUES FACTOR (A, B, C, D)B1 A A A AB2 B B B BB3 C C C CB4 D D D DB5 B B B BB6 A A A AB7 D D D DB8 C C C C

BLOQUES FACTOR (A, B, C, D)B1 A B C DB2 A B C DB3 A B C DB4 A B C DB5 A B C DB6 A B C DB7 A B C DB8 A B C D

BLOQUES FACTOR (A, B, C, D)B1 A B C DB2 B A D CB3 C D B AB4 D C A BB5 B A D CB6 D C A BB7 A B C DB8 C D B A

INCORRECTOMEJOR

(no aleatorizado el orden) CORRECTO

Page 73: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn estos diseños podemos distinguir dos grandes tipos de modelos, que van a determinar cómo se establecen los términos error (MS y g.l.) para estimar las significaciones.

• de una sola réplica por cada nivel del factor de interés, en cada nivel del factor bloque

• más de una réplica por cada nivel del factor de interés, en cada nivel del factor bloqueestos diseños se llaman "de bloques generalizados" .

73

BLOQUES FACTOR (A, B, C, D)B1 A   A A B   B   B C   C C D   D   DB2 B   B   B A   A   A D   D D C   C CB3 C   C   C D   D   D B   B   B A   A AB4 D   D   D C   C   C A   A   A B   B BB5 B   B   B A   A   A D   D   D C   C CB6 D   D   D C   C   C A   A   A B   B BB7 A   A   A B   B   B C   C   C D   D DB8 C   C   C D   D   D B   B   B A   A A

BLOQUES FACTOR (A, B, C, D)B1 A B C DB2 B A D CB3 C D B AB4 D C A BB5 B A D CB6 D C A BB7 A B C DB8 C D B A

GENERALIZADOde tres réplicas por BLOQUE*FACTOR

CLÁSICOuna réplica por BLOQUE

Page 74: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn los diseños de bloques perfectamente aleatorizados de una sola réplicano se pude construir la interacción BLOQUE*FACTOR(es) de interésal no existir variabilidad dentro de cada celda BLOQUE*FACTOR (1 muestra solamente)

El modelo se construye con los efectos principales BLOQUE y FACTOR(es), sin interacciónEl MS y g.l. del término error es común a todos los efectosEl MS y g.l. del término error son los residuales del modelo

74

tipos de factores paralos que se aplica

FACTOR

Page 75: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn el caso de dos FACTORES fijos de interés (A y C) y un factor BLOQUE (B, aleatorio),con una sola réplica por celda A*B*C, los términos error de las estimas son los siguientes:

75

se pueden hacer,pero no suelen

interesar

MSResidual

Page 76: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn el caso de dos FACTORES fijos de interés (A y C) y un factor BLOQUE (B) con una sola réplica por celda A*B*C,

si se considera que la variación entre factores a través de bloques es negligible, entonces se puede simplificar (y robustecer el modelo con mayores g.l. para los factores)y se utiliza como término error común el término error residual del modelo:

76

MSerror = MSresidual

Page 77: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesDiseño particular denominado de CUADRADOS LATINOS.

Se establecen dos factores BLOQUES que definen los ejes X e Y de un cuadrado,que establecen las celdas en las que se aplican los tratamientos del FACTOR de interés.

Se asume que el efecto de la interacción de los dos factores BLOQUE es nulo.

En cada celda de interacción BLOQUE‐X * BLOQUE‐Y se establece una única muestra.

Otros diseños implican dos BLOQUES no espaciales (e.g., operador y cultivar).

Se deben cumplir los criterios de perfecta aleatorización de los niveles del FACTOR.

En este diseño hay un MS y g.l. del término error común a todos los efectos.No estamos interesados en las interacciones ni entre BLOQUES ni en FACTOR*BLOQUEEl MS y g.l. del término error son los residuales del modelo

77

Page 78: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesDe CUADRADOS LATINOS.Ejemplos

78

sin fragmentar           muy fragmentado

Page 79: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASDiseños de bloquesEn los diseños de bloques GENERALIZADOS perfectamente aleatorizados con dos réplicas o más por celda BLOQUE*FACTORsí se pude construir la interacción BLOQUE*FACTOR(es) de interés

al existir variabilidad dentro de cada celda BLOQUE*FACTOR (2 o más muestras)el BLOQUE se suele considerar un factor aleatorio

El modelo se construye con: efectos principales BLOQUE y FACTOR(es) y la(s) interacción(es)El MS y g.l. del término error NO es común a todos los efectosPara el FACTOR, los MS y g.l. error son los datos de la interacción BLOQUE*FACTOR

sean "r" réplicas por celda BLOQUE*FACTOR

Efecto                      g.l. efecto                                      F                                          g.l. error BLOQUE                          b‐1              MSBLOQUE / MSFACTOR*BLOQUE      (b‐1)*(f‐1)FACTOR                           f‐1               MSFACTOR / MSFACTOR*BLOQUE       (b‐1)*(f‐1)FACTOR*BLOQUE    (b‐1)*(f‐1)        MSFACTOR*BLOQUE / MSRESIDUAL     f*b*(r‐1)

79

Page 80: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOS

n wayMANOVAS

80

Page 81: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA.

Situación particular en la que tenemos más de una variable respuesta "continua".

En determinadas circunstancias, las unidades muestrales manifiestan respuestas que no se miden con una sola variable, sino en un conjunto de variables. Esto es, la respuesta se mide por diferentes conceptos represenrados por diferentes parámetros.e.g., condición física valorada por la grasa, músculo, hematocrito, respuesta inmunee.g., morfología floral con diferentes dimensiones de longitud de pétalos, estambres, sépalos, etc

En este caso, si queremos valorar la influencia de diferentes efectos (recogidos por factores y covariantes), tendríamos que efectuar tantos diseños factoriales como variables respuesta hay.

Esto es inconveniente por dos motivos:* al hacer muchos modelos, y muchas estimas de significación, incrementamos el error de tipo I* esas variables respuesta pueden estar relacionadas entre sí, y en parte miden “lo mismo”

Ante esto, lo mejor es efectuar un único modelo (previo) que estime globalmente los efectos que las variables predictoras (sean factores o covariantes) tienen sobre el conjunto de las respuestas.

Esto lo abordamos con análisis Multivariantes de la varianza (MANOVA).Multivariante porque hay múltiples variables respuesta.

81

Page 82: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA. En general, vamos a proceder como en los diseños factoriales de efectos fijos ya vistos.Pero tenemos unos Supuestos añadidos.

* Requiere normalidad multivariante. Difícil de evaluar (buen paquete de análisis en MVN)

* Es necesario que exista homogeneidad de varianzas/covarianzas a través de los niveles de losfactores considerados (y sus interacciones si hay varios factores). Para ello contamos con elTest de la M de Box. Consultad:http://www‐01.ibm.com/support/knowledgecenter/SSLVMB_20.0.0/com.ibm.spss.statistics.cs/glmm_patlos_homcov.htmEste supuesto asume que el patrón de asociación entre las variables respuestas no cambia a través de los niveles de los factores (predictores nominales).Si violamos este supuesto … posible solución: transformar las variables respuesta

* Homogeneidad de las varianzas de las variables respuesta, teniendo en cuenta las celdasdefinidas por la interacción entre todos los factores nominales considerados.Mediante el Test de Levene examinamos este supuesto.Si no lo cumplimos … posible solución: transformar la variable respuesta que viola el supuestoEl caso más problemático es aquel en el que la varianza se asocia con la media de cada una de

las celdas de la interacción entre los factores.+ si la relación es positiva, aumenta el error de tipo I+ si la relación es negativa, aumenta el error de tipo II

82

Page 83: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Comenzamos cargando los siguientes paquetes de R:library(car) ## para obtener VIF's y usar Anova, bootCaselibrary(heplots) ## para la estima de los valores de partial eta2library(psych) ## para construir tablas con describelibrary(biotools) ## para efectuar el test de la M de Boxlibrary(MVN) ## para el test de la normalidad multivariante

ESPECIFICAMOS EL MODELO## Cargamos la siguiente línea de código para obtener contrastes definidos## Se obtienen los mismos resultados que STATISTICA y SPSS utilizando type III SS

options(contrasts=c(factor="contr.sum", ordered="contr.poly"))

## establecemos la ecuación de nuestro modelo## definimos las variables respuesta a la izquierda de ~ mediante el comando cbind(...)

eqt <- as.formula(cbind(PESO,MUSCULO,TASAINV) ~ TARSO + ZONA*SEXO*EDAD)

## ahora creamos nuestro modelo MANOVA en dos pasos: primero un modelo lm y luego MANOVA## test.statistic puede ser "Pillai", "Wilks", "Hotelling-Lawley", "Roy“ ## o varios de ellos: test.statistic=c("Pillai", "Wilks", "Hotelling-Lawley", "Roy")## con type=3 especificamos si queremos una estima de efectos parciales (SS tipo III)

man_mod <- lm(eqt, data=datos)modelo <- Manova(man_mod, type=3, test.statistic="Pillai") 83

Page 84: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes## Normalidad Multivariante de las variables respuesta originales## mirad: https://cran.r-project.org/web/packages/MVN/vignettes/MVN.pdf## antes convertimos nuestras variables respuesta en una matriz con as.matrix

## plots: con histogramas y Q-Q plots

uniPlot(as.matrix(man_mod$model[1]), type="histogram")uniPlot(as.matrix(man_mod$model[1]), type="qqplot")

## identificación de outliers multivariantesmvOutlier(as.matrix(man_mod$model[1]), qqplot=TRUE, method="quan")

## tests de desvío de la normalidad multivariante## test de Mardia

mardiaTest(as.matrix(man_mod$model[1]), qqplot=TRUE)

## test de Royston; para casos en que el tamaño muestral (N) sea < 50

roystonTest(as.matrix(man_mod$model[1]), qqplot=TRUE)

## usaremos el test de Henze-Zirkler cuando N > 100

hzTest(as.matrix(man_mod$model[1]), qqplot=TRUE)

84

Page 85: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes

85

Page 86: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes

86

exploramos quépasa con los datosseñalados en rojo

Page 87: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes> mardiaTest(as.matrix(man_mod$model[1]), qqplot=TRUE)

Mardia's Multivariate Normality Test ---------------------------------------

data : as.matrix(man_mod$model[1]) g1p : 3.636029 chi.skew : 23.02818 p.value.skew : 0.01064303

g2p : 18.1312 z.kurtosis : 1.762026 p.value.kurt : 0.07806487

chi.small.skew : 25.84004 p.value.small : 0.003961381 Result : Data are not multivariate normal.

---------------------------------------

> roystonTest(as.matrix(man_mod$model[1]), qqplot=TRUE)Royston's Multivariate Normality Test

---------------------------------------------data : as.matrix(man_mod$model[1]) H : 8.614611 p-value : 0.03085017 Result : Data are not multivariate normal.

--------------------------------------------- 87

Page 88: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes

88

Q‐Q plot para visualización de lanormalidad multivariante

Page 89: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes## efectuamos el test de la M de Box, con cada factor del análisis## "sacamos" las variables respuesta de nuestro modelo lm llamado man_mod## mediante man_mod$model[1], que incluye las variables reunidas con cbind(…)## podemos analizar los efectos de factores uno por uno, o sus interacciones## Si no podemos efectuar la interacción completa (por falta de muestra),## probad con efectos principales e interacciones dobles

boxM(man_mod$model[1], datos$ZONA)boxM(man_mod$model[1], datos$SEXO:datos$EDAD)

> boxM(man_mod$model[1], datos$ZONA)Box's M-test for Homogeneity of Covariance Matrices

data: man_mod$model[1]Chi-Sq (approx.) = 11.968, df = 6, p-value = 0.06269

> boxM(man_mod$model[1], datos$SEXO:datos$EDAD)Box's M-test for Homogeneity of Covariance Matrices

data: man_mod$model[1]Chi-Sq (approx.) = 26.0966, df = 18, p-value = 0.09757

89

Page 90: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes## efectuamos el test de Levene## TEST DE HOMOGENEIDAD DE VARIANZAS a través de los niveles de los factores## no admite covariantes## otra opción es center=mean (la del programa STATISTICA)## lo hacemos con cada una de las variables respuesta; aquí como ejemplo sólo con una

leveneTest(MUSCULO~ZONA:SEXO:EDAD, data=datos, center=median)

Levene's Test for Homogeneity of Variance (center = median)Df F value Pr(>F)

group 7 0.4655 0.851630

Hemos violado el supuesto de normalidad multivariante (levemente) y el de  homogeneidad de varianzas/covarianzas a través de los niveles de los factores considerados, pero no el de homogeneidad de las varianzas de las variables respuesta (teniendo en cuenta las celdas definidas por la interacción entre todos los factores nominales considerados).

Podríamos transformar las variables respuesta (e.g., en logaritmo) y volver a repetir el proceso.

90

Page 91: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

91

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantesExploración del supuesto de la normalidad de los residuos

## descripción de los residuos y test de Shapiro-Wilk de su desvío de la normalidad

uniNorm(residuals(man_mod), type="SW", desc=TRUE)

$`Descriptive Statistics`n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis

PESO 38 0 0.451 -0.053 -0.669 1.124 -0.346 0.310 0.699 -0.126MUSCULO 38 0 0.329 -0.061 -0.581 0.824 -0.222 0.177 0.572 -0.365TASAINV 38 0 0.102 0.001 -0.287 0.229 -0.061 0.050 -0.120 0.449

$`Shapiro-Wilk's Normality Test`Variable Statistic p-value Normality

1 PESO 0.9458 0.0649 YES 2 MUSCULO 0.9618 0.2168 YES 3 TASAINV 0.9794 0.6961 YES

Page 92: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

92

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes## exploración visual de los residuos de las variables respuesta tras hacer el modelo

nvarresp <- length(colnames(man_mod$model[,1]))par(mfcol=c(1,1))for (i in 1:nvarresp) {

qqnorm(residuals(man_mod)[,i], main=colnames(residuals(man_mod))[i])qqline(residuals(man_mod)[,i], col="red")

}##

Page 93: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

93

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Pruebas importantes## Exploración del supuesto de la Homocedasticidad de los residuospar(mfcol=c(1,1))for (i in 1:nvarresp) {

plot(fitted(man_mod)[,i], residuals(man_mod)[,i], ylab="RESIDUOS", xlab="PREDICHOS", main=colnames(residuals(man_mod))[i])

abline(h=0, col="red")}##

Page 94: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

VARIANZA EXPLICADA DE CADA VARIABLE RESPUESTA## códigos de cálculonvarresp <- length(colnames(man_mod$model[,1]))nombresresp <- as.factor(vector(length=nvarresp))nombresresp <- colnames(man_mod$model[,1])SStotal <- vector(length=nvarresp)SSerror <- vector(length=nvarresp)porvarianza <- vector(length=nvarresp)## bucle de cálculofor (i in 1:nvarresp) {

SStotal[i] <- sum((man_mod$model[,1][,i]-mean(man_mod$model[,1][,i]))^2)SSerror[i] <- modelo$SSPE[i,i]porvarianza[i] <- ((SStotal[i]-SSerror[i])/SStotal[i])*100

}##

## tabla de resultados; "porvarianza" es el % de la varianza explicado## por todo el modelo para cada variable respuesta

tablavarianza <- round(data.frame(porvarianza, SStotal, SSerror), 3)print(data.frame(nombresresp, tablavarianza))

nombresresp porvarianza SStotal SSerror1 PESO 82.736 43.523 7.5142 MUSCULO 72.991 14.842 4.0093 TASAINV 74.587 1.515 0.385

94

Page 95: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Primeros resultados## Resultados del modelo y sus estimas multivariantes

summary(modelo, multivariate=TRUE)

Es una salida larguísima. Por ejemplo, veamos los resultados particulares sólo para el efecto ZONA:SEXO

------------------------------------------

Term: ZONA:SEXO

Sum of squares and products for the hypothesis:PESO MUSCULO TASAINV

PESO 0.05312621 -0.10512648 -0.04329099MUSCULO -0.10512648 0.20802496 0.08566448TASAINV -0.04329099 0.08566448 0.03527655

Multivariate Tests: ZONA:SEXODf test stat approx F num Df den Df Pr(>F)

Pillai 1 0.1402584 1.468262 3 27 0.24533Wilks 1 0.8597416 1.468262 3 27 0.24533Hotelling-Lawley 1 0.1631402 1.468262 3 27 0.24533Roy 1 0.1631402 1.468262 3 27 0.24533

------------------------------------------

95

Page 96: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Resultados globales## importancia de los efectos en el modelo (effect sizes) y significaciones## es una estimación multivariante para el conjunto de las variables respuesta## es una tabla más sintética que la de summary(...)## parial eta2 (eta^2), Df's, el estadístico seleccionado (Pillai's, ...), la F y ## la significación de SS tipo-III si hemos usado Manova(..., type=3, ...).

etasq(modelo, anova=TRUE)

Type III MANOVA Tests: Pillai test statisticeta^2 Df test stat approx F num Df den Df Pr(>F)

(Intercept) 0.13980 1 0.13980 1.4627 3 27 0.2468137 TARSO 0.52913 1 0.52913 10.1134 3 27 0.0001225 ***ZONA 0.69367 1 0.69367 20.3802 3 27 4.169e-07 ***SEXO 0.31510 1 0.31510 4.1406 3 27 0.0154589 * EDAD 0.17587 1 0.17587 1.9206 3 27 0.1500578 ZONA:SEXO 0.14026 1 0.14026 1.4683 3 27 0.2453283 ZONA:EDAD 0.11424 1 0.11424 1.1608 3 27 0.3428560 SEXO:EDAD 0.26287 1 0.26287 3.2095 3 27 0.0387591 * ZONA:SEXO:EDAD 0.16788 1 0.16788 1.8158 3 27 0.1680891 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

## Sólo vamos a ver los resultados univariantes de los efectos de nuestro modelo MANOVA, ## para aquellos términos multivariantes que hayan aportado significación

96

Page 97: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “ENTRE” SUJETOSn way ANOVAS y MANOVASAnálisis Multivariantes de la Varianza ‐MAN(c)OVA

Resultados particulares por cada variable respuesta## Obtenemos el resumen del modelo lm

summary(man_mod)

## ejemplo de la salida para la segunda variable respuesta## se proporcionan los coeficientes de regresión

Response MUSCULO :Call:lm(formula = MUSCULO ~ TARSO + ZONA * SEXO * EDAD, data = datos). . . .

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) -2.35435 2.20612 -1.067 0.294689 TARSO 0.26179 0.11316 2.314 0.027983 * ZONA1 -0.24552 0.06461 -3.800 0.000687 ***SEXO1 -0.24987 0.07810 -3.199 0.003323 ** EDAD1 0.10629 0.07120 1.493 0.146297 ZONA1:SEXO1 0.07874 0.06419 1.227 0.229786 ZONA1:EDAD1 -0.04819 0.06632 -0.727 0.473217 SEXO1:EDAD1 -0.08726 0.06511 -1.340 0.190551 ZONA1:SEXO1:EDAD1 0.12454 0.06482 1.921 0.064565 . ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3718 on 29 degrees of freedomMultiple R-squared: 0.7299, Adjusted R-squared: 0.6554 F-statistic: 9.797 on 8 and 29 DF, p-value: 1.781e-06 97

Page 98: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOS

n way ANOVASde medidas REPETIDAS(within subjects designs)

98

Page 99: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEn estos diseños se toman diferentes medidas sobre las mismas unidades muestrales.

Estas diferentes medidas vienen definidas por los niveles de los factores quedenominamos "dentro" de sujetos(e.g., mediciones por la noche y el día; medidas del lado derecho y el izquierdo) 

En estos diseños podemos tener uno o más factores "dentro" de sujetos que puedeninteraccionar entre sí. En esta circunstancia, el número de pseudorréplicas por unidadmuestral viene definida por el número de celdas en la interacción de los factores.

Realmente esas diferentes medidas de la misma unidad muestral definen:varias variables respuesta, cada una de las cuales define un nivel del factor "dentro"

Además podemos contar en estos diseños con otros factores "entre" sujetos, que incluyen en sus niveles a unidades muestrales diferentes.

También podemos considerar covariantes que afectan al valor de la respuesta. Pueden ser:covariantes fijas: un solo valor de la covariante por cada unidad muestralcovariantes cambiantes: un valor de la covariante para cada unidad muestral en

cada nivel del factor "dentro" de sujetos.99

Page 100: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

100

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

Veámoslo gráficamente.

Existen 8 unidades muestrales (elipses)"sujetos"

Sea un factor F con seis niveles:niveles 1, 2, 3, 4, 5, 6 (en cajitas).

Este es un factor “dentro de” muestra.Todos los niveles del Factor F estánrepresentados en cada unidad muestralcon una sola réplica (cajitas con números)

Y definimos un nuevo factor Bcon dos niveles (gris y blanco)establecido fuera de las muestrasque es un factor “entre” muestras.

El diseño se podría complicar usandootro factor “entre” muestras.

Page 101: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

Las verdaderas unidades muestrales, que definirán los términos error para la estima de lasignificación (F, g.l. y p), no son las réplicas, sino los "sujetos" en los cuales se miderepetidamente la misma variable respuesta, 

El número de veces es: los niveles del factor repetido o "dentro" de sujetos.

Estos diseños evitan la pseudorreplicación,y efectúan un control de la variabilidad aleatoria entre sujetos

de gran utilidad para estimar efectos sutiles "dentro" de sujetos

A la hora de abordar el análisis de datos podemos establecer dos "diseños de la matriz".Horizontal: una fila por "sujeto" o unidad muestral correcta.

Vamos a utilizar este diseño que permite más posibilidades.Vertical: las réplicas del mismo sujeto se ponen en filas distintas, y se añade una

columna que define la adscripción de la réplica‐fila al "sujeto"Este FACTOR‐"sujeto" se tratará como un factor aleatorio.Este diseño permite menos posibilidades de análisis:

sólo acepta un factor "dentro" de sujetos101

Page 102: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasVamos a proceder como lo haríamos en otros diseños factoriales ya presentados,

considerando los mismos requisitos y pruebas canónicas del buen uso de los ANOVA.

* Requiere normalidad multivariante. Difícil de evaluar (buen paquete de análisis en MVN)

* Es necesario que exista homogeneidad de varianzas/covarianzas a través de los niveles de losfactores fijos considerados (y sus interacciones si hay varios factores). Para ello contamos con el Test de la M de Box. 

Consultad:  http://www‐01.ibm.com/support/knowledgecenter/SSLVMB_20.0.0/com.ibm.spss.statistics.cs/glmm_patlos_homcov.htmEste supuesto asume que el patrón de asociación entre las variables respuesta no cambia a través de los niveles de los factores  fijos (predictores nominales).Si violamos este supuesto … posible solución: transformar las variables respuesta

* Homogeneidad de las varianzas de las variables respuesta, teniendo en cuenta las celdasdefinidas por la interacción entre todos los factores fijos considerados.Mediante el Test de Levene examinamos este supuesto.Si no lo cumplimos … posible solución: transformar la variable respuesta que viola el supuestoEl caso más problemático es aquel en el que la varianza se asocia con la media de cada una delas celdas de la interacción entre los factores.

+ si la relación es positiva, aumenta el error de tipo I+ si la relación es negativa, aumenta el error de tipo II

102

Page 103: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

Tenemos otros Supuestos añadidos:Esfericidad y Simetría compuesta (sólo aplicables a factores “dentro” con tres o más niveles)

SIMETRÍA COMPUESTA: Las varianzas de los tratamientos y las covarianzas entre ellos nodifieren entre sí. Esto se aplica a los factores "dentro" de sujetos o repetidos.Compararemos los resultados del ANOVA de medidas repetidas con los pronosticados por los ajustes efectuados por los tests de Greenhouse‐Geisser y Huynh‐Feldt.Comparamos las p's y los g.l. Más recomendable la aproximación de Huynh‐Feldt.

ESFERICIDAD: Las varianzas de las diferencias dentro de "sujetos" entre los diferentesniveles de los factores repetidos son homogéneas. Test de Mauchley.https://en.wikipedia.org/wiki/Mauchly%27s_sphericity_test

103

Page 104: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

104

si se violan estos dos supuestospasaremos a utilizar los resultados

del MANOVA

Page 105: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas¿Cómo hacerlo? Versión con matriz de datos HORIZONTAL

Vamos a desarrollarlo, de manera muy flexible y potente, usando el paquete {car}Con esta forma de proceder podremos abordar diseños con uno o más factores “dentro”.Podremos considerar covariantes de efectos fijos (una o varias) y cambiantes.

Ejemplo:26 individuos (filas) ensayados en cuatro situaciones diferentes que fueron aleatorizadasDos factores “dentro”: RADIACION (infrarroja, luz_visible) y POSICION (invertido, normal)los dos factores definen 2*2=4 columnas de datos de la variable respuesta tasa

Una covariante de valores fijos: covarfijaUna covariante cambiante: definida por cuatro columnas (temperaturas de cada ensayo)Un factor “entre” sujetos que codifica si los escarabajos tienen o no los élitos fusionados

factorfijo con dos niveles (sí, no)

Existirá una variable respuesta con cuatro columnas (una por situación experimental)Existirán tantas filas como unidades muestrales hayaCada covariante fija toma un valor único por fila.La covariante cambiante toma valores en cuatro columnas(una por situación experimental)

105

Page 106: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas¿Cómo hacerlo? Versión con matriz de datos HORIZONTAL

106covariante fija

factor “entre”sujetos

2 factores “dentro”de sujetos

de la respuestaasíntota

organizados así:infrarrojo   invertidoinfrarrojo   normalluz               invertidoluz               normal

covariante cambiante

Page 107: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas¿Cómo hacerlo? Versión con matriz de datos HORIZONTAL

En esta ejemplificación sólo podremos realizar modelos generales lineales (GLM)asumiendo que trabajamos con una gausianapodremos transformar la variable respuesta con el objeto de aproximarnos a los supuestos canónicos de GLM

aplicaremos la misma transformación a las diferentes columnas que definen la variable respuesta

## CARGAMOS LOS PAQUETES:library(car) ## para obtener VIF's y usar Anova, bootCaselibrary(lmtest) ## para usar coeftest y correcciones por heterocedasticidadlibrary(sandwich) ## para correcciones de heterocedasticidad usando vcovHClibrary(biotools) ## para efectuar el test de la M de Boxlibrary(MVN) ## para el test de la normalidad multivariante

## ESPECIFICAMOS LAS TABLAS DE CONTRASTES PARA LOS FACTORES## Cargamos la siguiente línea de código para obtener contrastes definidos## Se obtienen los mismos resultados que STATISTICA y SPSS utilizando type III SS## As the treatment factors are unordered factors, R will use contr.sum in order to construct a contrast matrix of the apropriate order.

options(contrasts=c(factor="contr.sum", ordered="contr.poly"))

107

Page 108: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasOrganización de datos de efectos dentro de sujetos (within‐subjects)

## combinamos con cbind los efectos within-subjects, ## sean de factores o covariantes cambiantes

¡¡¡ esto es aparentemente lo más complicado !!!Es puro orden y saber qué queremos hacer

## para la RESPUESTA, FACTOR DENTRO DE two-way ## ponemos ordenadamente la secuencia de mis variables respuesta## definir cómo organizar esas columnas: primero la FUENTE y dentro de eso la POSICIÓN## aquí están los valores: respuesta2w.dentro <- cbind(datos$tasa_inf_inv, datos$tasa_inf_nor, datos$tasa_luz_inv, datos$tasa_luz_nor)

## Construimos un nuevo dataframe con los niveles ordenados de los factores## según hemos re-estructurado los valores de la respuesta en respuesta2w.dentro## definimos los niveles del primer factor con los nombres que queramosFUENTE <- factor(c("Infra","Infra","Luz","Luz"))

## definimos los niveles del otro factor con los nombres sencillos que queramosPOSICION <- factor(c("Invertido","Normal","Invertido","Normal"))

## combinamos los dos factores en un dataframe## aquí están los nombres inteligibles:factor2w.dentro <- data.frame(FUENTE, POSICION)

108

Page 109: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasOrganización de datos de efectos dentro de sujetos (within‐subjects)

## veamos qué hemos generado

> respuesta2w.dentro[,1] [,2] [,3] [,4]

[1,] 0.019 0.021 0.018 0.017[2,] 0.031 0.036 0.035 0.031[3,] 0.007 0.021 0.007 0.018[4,] 0.021 0.025 0.024 0.028[5,] 0.020 0.028 0.020 0.019[6,] 0.031 0.037 0.037 0.035[7,] 0.018 0.023 0.015 0.016[8,] 0.016 0.017 0.019 0.016[9,] 0.020 0.011 0.014 0.019. . . . . .

[24,] 0.020 0.020 0.018 0.019[25,] 0.017 0.016 0.016 0.017[26,] 0.025 0.026 0.021 0.025

hay 26 observaciones o unidades muestrales realmente independientes

109

> factor2w.dentroFUENTE POSICION

1 Infra Invertido2 Infra Normal3 Luz Invertido4 Luz Normal

la columna [,1] es 1 Infra Invertidola columna [,2] es 2 Infra Normal. . . etc

Page 110: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasOrganización de datos de efectos dentro de sujetos (within‐subjects)

## COVARIANTE CAMBIANTE DENTRO DE SUJETOS## usamos el mismo orden-secuencia que el utilizado para la respuesta ¡¡¡esto es muy importante!!!

covariante2w.dentro <- cbind(datos$temp_inf_inv, datos$temp_inf_nor, datos$temp_luz_inv, datos$temp_luz_nor)

## CONSTRUIMOS EL MODELO AN(c)OVA## two-way within-subjects factors & one between-subjects factor, with one fixed covariate plus one changing covariate

## que tiene un submodelo (submodelo) que se incluye en Anova(…)## tiene la forma: respuesta-repetida ~ ## factor_fijo + covariante_fija + covariante_cambiante

## idata define cuál es la estructura del factor-dentro-de-sujetos## idesign define qué diseño within-subjects queremos hacer (aquí two-way con interacción)## type=3 establece un diseño de suma de cuadrados (SS) de tipo 3 (efectos parciales)

submodelo <- lm(respuesta2w.dentro ~ datos$factorfijo + datos$covarfija + covariante2w.dentro)

modelo <- Anova(submodelo, idata=factor2w.dentro, idesign=~FUENTE*POSICION, type="III")

¡¡¡ terminamos !!!esto es imposible hacerlo con STATISTICA o con SPSS

110

Page 111: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)## Normalidad de las variables respuesta originales## mirad: https://cran.r-project.org/web/packages/MVN/vignettes/MVN.pdf## descriptores de nuestras variables originales y ## test de Shapiro-Wilk de desvío de la normalidad

uniNorm(as.matrix(respuesta2w.dentro), type="SW", desc=TRUE)

las filas 1, 2, 3, 4 se corresponden con las cuatro columnas “respuesta” de respuesta2w.dentro

$`Descriptive Statistics`n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis

1 26 0.022 0.006 0.020 0.007 0.032 0.018 0.026 -0.251 -0.3582 26 0.024 0.007 0.024 0.011 0.037 0.019 0.030 -0.108 -0.9903 26 0.021 0.007 0.020 0.007 0.037 0.017 0.024 0.283 -0.2724 26 0.023 0.007 0.022 0.009 0.038 0.017 0.027 0.421 -0.507

$`Shapiro-Wilk's Normality Test`Variable Statistic p-value Normality

1 Column1 0.9437 0.1645 YES 2 Column2 0.9716 0.6661 YES 3 Column3 0.9716 0.6663 YES 4 Column4 0.9603 0.3981 YES

111

Page 112: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)## plots: de histogramas y Q-Q plotspar(mfcol=c(1,1))uniPlot(as.matrix(respuesta2w.dentro), type="histogram")uniPlot(as.matrix(respuesta2w.dentro), type="qqplot")par(mfcol=c(1,1))

## efectuamos el test de la M de Box, SÓLO con factores "entre sujetos" del análisis## "sacamos" las variables respuesta de nuestro objeto creado con cbind(...)## Si no podemos efectuar la interacción completa (por falta de muestra),## probad con efectos principales e interacciones dobles

boxM(respuesta2w.dentro, datos$factorfijo)

Box's M-test for Homogeneity of Covariance Matricesdata: respuesta2w.dentroChi-Sq (approx.) = 6.0035, df = 10, p-value = 0.815

## Normalidad Multivariante: test de Royston; para cuando el tamaño muestral (N) sea < 50## usaremos el test de Henze-Zirkler cuando N > 100: hzTest(...)roystonTest(as.matrix(respuesta2w.dentro), qqplot=TRUE)

112

Page 113: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)

113

V1, V2, … son las variables respuestaincluidas en cbind(…)

Page 114: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)> roystonTest(as.matrix(respuesta2w.dentro), qqplot=TRUE)

Royston's Multivariate Normality Test -----------------------------------------

data : as.matrix(respuesta2w.dentro)

H : 1.92385 p-value : 0.4997546

Result : Data are multivariate normal. ---------------------------------------------

114

Page 115: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)## TEST DE HOMOGENEIDAD DE VARIANZAS a través de los niveles de los factores "entre sujetos"## no admite covariantes## lo hacemos con cada una de las variables respuesta, y con el factor datos$factorfijo

nvarresp <- dim(factor2w.dentro)[1]for (i in 1:nvarresp) {

print(c("Respuesta", i), quote=FALSE)print(leveneTest(respuesta2w.dentro[,i] ~ datos$factorfijo, data=datos, center=median))print("******************************************************", quote=FALSE)

}

[1] Respuesta 1 Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)group 1 0.0365 0.8501

24 [1] ******************************************************[1] Respuesta 2Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)group 1 0.8443 0.3673

24 [1] ******************************************************[1] Respuesta 3 Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)group 1 0.1327 0.7188

24 [1] ******************************************************[1] Respuesta 4 Levene's Test for Homogeneity of Variance (center = median)

Df F value Pr(>F)group 1 0.0826 0.7763

24 [1] ******************************************************

115

Page 116: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (residuos)

## los visualizamos## es para el conjunto de las N filas-observaciones x r variables respuesta

hist(residuals(submodelo))qqnorm(residuals(submodelo))qqline(residuals(submodelo) , col="red")

## test de Shapiro de normalidad de residuosshapiro.test(residuals(submodelo))

Shapiro-Wilk normality testdata: residuals(submodelo)W = 0.9811, p-value = 0.1448

116

Page 117: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (residuos)

117

Page 118: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasEXPLORACIÓN DE LOS SUPUESTOS CANÓNICOS DEL MODELO (respuestas originales)## Homocedasticidad de los residuos a través de las predicciones del modelo

plot(fitted(submodelo), residuals(submodelo), main="relación entre residuos y predicciones")abline(h=0, col="red")

118

Page 119: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasRESULTADOS## tabla sintética de efectos con la aproximación within-subjects

summary(modelo, multivariate=FALSE)

Univariate Type III Repeated-Measures ANOVA Assuming Sphericity

SS num Df Error SS den Df F Pr(>F) (Intercept) 0.00119338 1 0.00260278 19 8.7115 0.008194 **datos$factorfijo 0.00003082 1 0.00260278 19 0.2250 0.640697 datos$covarfija 0.00073085 1 0.00260278 19 5.3351 0.032298 * covariante2w.dentro 0.00092379 4 0.00260278 19 1.6859 0.194738 FUENTE 0.00000264 1 0.00010984 19 0.4562 0.507526 datos$factorfijo:FUENTE 0.00000322 1 0.00010984 19 0.5567 0.464734 datos$covarfija:FUENTE 0.00000021 1 0.00010984 19 0.0366 0.850351 covariante2w.dentro:FUENTE 0.00002523 4 0.00010984 19 1.0913 0.389034 POSICION 0.00001113 1 0.00017871 19 1.1832 0.290308 datos$factorfijo:POSICION 0.00000475 1 0.00017871 19 0.5045 0.486163 datos$covarfija:POSICION 0.00000412 1 0.00017871 19 0.4378 0.516146 covariante2w.dentro:POSICION 0.00002750 4 0.00017871 19 0.7311 0.581904 FUENTE:POSICION 0.00001313 1 0.00008093 19 3.0832 0.095211 . datos$factorfijo:FUENTE:POSICION 0.00000942 1 0.00008093 19 2.2125 0.153301 datos$covarfija:FUENTE:POSICION 0.00000892 1 0.00008093 19 2.0946 0.164123 covariante2w.dentro:FUENTE:POSICION 0.00008277 4 0.00008093 19 4.8577 0.007201 **---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

119

interacciones con factores “dentro de”

Page 120: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasRESULTADOS## la misma tabla de antes pero añadiendo los valores de partial eta2

tabla <- data.frame(summary(modelo, multivariate=FALSE)$univariate.tests[,])partialeta2 <- tabla$SS/(tabla$SS+tabla$Error.SS)tabla.anova <- data.frame(tabla, partialeta2)round(tabla.anova, 5)

SS num.Df Error.SS den.Df F Pr..F. partialeta2(Intercept) 0.00119 1 0.00260 19 8.71152 0.00819 0.31436datos$factorfijo 0.00003 1 0.00260 19 0.22495 0.64070 0.01170datos$covarfija 0.00073 1 0.00260 19 5.33509 0.03230 0.21923covariante2w.dentro 0.00092 4 0.00260 19 1.68589 0.19474 0.26195FUENTE 0.00000 1 0.00011 19 0.45624 0.50753 0.02345datos$factorfijo:FUENTE 0.00000 1 0.00011 19 0.55668 0.46473 0.02846datos$covarfija:FUENTE 0.00000 1 0.00011 19 0.03658 0.85035 0.00192covariante2w.dentro:FUENTE 0.00003 4 0.00011 19 1.09130 0.38903 0.18682POSICION 0.00001 1 0.00018 19 1.18322 0.29031 0.05862datos$factorfijo:POSICION 0.00000 1 0.00018 19 0.50448 0.48616 0.02587datos$covarfija:POSICION 0.00000 1 0.00018 19 0.43777 0.51615 0.02252covariante2w.dentro:POSICION 0.00003 4 0.00018 19 0.73105 0.58190 0.13338FUENTE:POSICION 0.00001 1 0.00008 19 3.08323 0.09521 0.13962datos$factorfijo:FUENTE:POSICION 0.00001 1 0.00008 19 2.21254 0.15330 0.10430datos$covarfija:FUENTE:POSICION 0.00001 1 0.00008 19 2.09456 0.16412 0.09929covariante2w.dentro:FUENTE:POSICION 0.00008 4 0.00008 19 4.85770 0.00720 0.50560

120

Page 121: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasRESULTADOSSi nuestros factores repetidos hubiesen tenido tres niveles o más, habríamos obtenido los test de Mauchly de esfericidad y las estimas corregidas de Greenhouse‐Geisser y Huynh‐Feldt

ejemplo con otros datos:Univariate Type III Repeated-Measures ANOVA Assuming Sphericity

SS num Df Error SS den Df F Pr(>F) (Intercept) 7260.0 1 603.33 15 180.4972 9.100e-10 ***phase 167.5 2 169.17 30 14.8522 3.286e-05 ***hour 106.3 4 73.71 60 21.6309 4.360e-11 ***phase:hour 11.1 8 122.92 120 1.3525 0.2245 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Mauchly Tests for SphericityTest statistic p-value

phase 0.70470 0.086304hour 0.11516 0.000718phase:hour 0.01139 0.027376

Greenhouse-Geisser and Huynh-Feldt Correctionsfor Departure from Sphericity

GG eps Pr(>F[GG]) phase 0.77202 0.0001891 ***hour 0.49842 1.578e-06 ***phase:hour 0.51297 0.2602357 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

HF eps Pr(>F[HF]) phase 0.84367 0.0001089 ***hour 0.57470 3.161e-07 ***phase:hour 0.73031 0.2439922 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

121

recomiendo consultar:http://yatani.jp/teaching/doku.php?id=hcistats:anova

Page 122: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasRESULTADOS## salida multivariante al estilo MANOVA por si hubiésemos violado## los supuestos de esfericidad y simetría compuesta## al final proporciona la tabla Repeated-Measures ANOVA Assuming Sphericity

summary(modelo, multivariate=TRUE)

proporciona una larguísima salida de resultados;   e.g. para la interacción de los dos factores “dentro de”------------------------------------------Term: FUENTE:POSICION

Response transformation matrix:FUENTE1:POSICION1

[1,] 1[2,] -1[3,] -1[4,] 1

Sum of squares and products for the hypothesis:FUENTE1:POSICION1

FUENTE1:POSICION1 5.253206e-05

Sum of squares and products for error:FUENTE1:POSICION1

FUENTE1:POSICION1 0.0003237217

Multivariate Tests: FUENTE:POSICIONDf test stat approx F num Df den Df Pr(>F)

Pillai 1 0.1396187 3.083232 1 19 0.095211 .Wilks 1 0.8603813 3.083232 1 19 0.095211 .Hotelling-Lawley 1 0.1622754 3.083232 1 19 0.095211 .Roy 1 0.1622754 3.083232 1 19 0.095211 .---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1------------------------------------------

122

Page 123: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas RepetidasRESULTADOS## pormenorizados para cada variable respuesta## que son los niveles de los factores "dentro de"

summary(submodelo)

e.g., para la cuarta columna de la respuesta   datos$tasa_luz_nor

Response Y4 :

Call:lm(formula = Y4 ~ datos$factorfijo + datos$covarfija + covariante2w.dentro)

Residuals:Min 1Q Median 3Q Max

-0.0096152 -0.0034412 -0.0009255 0.0021371 0.0108241

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.177e-01 4.161e-02 2.830 0.0107 *datos$factorfijo1 -2.093e-04 1.780e-03 -0.118 0.9076 datos$covarfija -1.591e-05 8.976e-06 -1.773 0.0923 .covariante2w.dentro1 -1.276e-03 9.243e-04 -1.381 0.1834 covariante2w.dentro2 -3.783e-04 1.114e-03 -0.340 0.7379 covariante2w.dentro3 -4.388e-04 8.008e-04 -0.548 0.5901 covariante2w.dentro4 -6.553e-04 5.685e-04 -1.153 0.2633 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.00634 on 19 degrees of freedomMultiple R-squared: 0.3743, Adjusted R-squared: 0.1767 F-statistic: 1.894 on 6 and 19 DF, p-value: 0.1342 123

Page 124: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOS

diseñossplit‐plot

split‐split‐…‐plot

124

Page 125: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

SPLIT‐PLOT DESIGNSSon un caso particular de medidas repetidas en el que se mezclan factores:“dentro de” sujetos establecidos dentro de los mismos bloques“entre” sujetos establecidos sobre diferentes bloques

Esto es, son unos diseños “mixtos” que mezclan factores “entre” con “dentro de”.

Estos diseños son también un caso particular de los diseños de bloques, en los que no es posible aleatorizar todos los efectos (factores) de interés dentro de los diferentes bloques de estudio.

La idea de split se refiere a que hacemos una división dentro de los bloques atendiendo ael número de niveles establecidos para los factores “dentro de”.

El diseño split‐plot tiene un solo factor “dentro de”.El diseño split‐split‐plot tiene dos factores “dentro de”.… y así sucesivamente.

Generalmente, en estos diseños se establece una única réplica dentro de cada bloquepara cada nivel del factor “dentro de” de define el efecto split.

125

Page 126: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

SPLIT‐PLOT DESIGNSVeámoslo gráficamente.

Existen 8 bloques (elipses)

Sea un factor F con seis niveles:niveles 1, 2, 3, 4, 5, 6 (en cajitas).

Este es un factor “dentro de” bloque.Todos los niveles del Factor F estánrepresentados en cada bloquecon una sola réplica (cajitas con números)

Y definimos un nuevo factor Bcon dos niveles (gris y blanco)establecido fuera de los bloquesque es un factor “entre” bloques.

El diseño se podría complicar usando más bloquesutilizando otro factor “entre” bloques.

126

Page 127: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

SPLIT‐PLOT DESIGNSEn este diseño, al igual que en el ejemplo de ANOVA de medidas repetidas con los escarabajos, cada bloque es una fila en la matriz horizontal de datos.

Las diferentes columnas de la matriz horizontal miden los valores que toma la respuesta en cada uno de los niveles “dentro” (repetidos) de el/los factor(es) considerado(s).

De aquí que suele ser conveniente, para facilitar los análisis, que haya una sola réplicade los niveles de los factores  split (“dentro de”) en cada bloque.

La razón de ser de estos diseños estriba en que es imposible, por cuestiones logísticas, que todos los factores de nuestro diseño experimental estén replicados dentro de cada bloque.

Por ejemplo, es imposible que un escarabajo pueda tener simultáneamente los élitrosfusionados y no‐fusionados.

Hay parcelas‐bloques de cultivo que no pueden incluir todos los tratamientosEn cada bloque se pueden sembrar varias variedades y se pueden poner diferentes dosis de abonopero puede que sea imposible aplicar poco y mucho riego por los sistemas mecánicos de irrigaciónen el mismo bloque.

127

Page 128: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas

SPLIT‐PLOT DESIGNSEn pocas palabras:

son diseños de medidas repetidascon unos factores “dentro de” sujetos

y otros factores “entre” sujetosPodremos incluir covariantes (ANCOVA de medidas repetidas)y cuantos más factores repetidos “dentro de” haya … más split‐split‐… es nuestro diseño.

En situaciones en las que exista más de una réplica por bloque, el diseño se complica.Pero es abordable utilizando diseños de AN(c)OVAs ENCAJADOS.

Las distintas réplicas de los efectos split “dentro de” se anidarán dentro de los bloques,de manera que los bloques son las verdaderas unidades muestrales

(que definen los MS y g.l. correctos para el término error).128

Page 129: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticalesAplicación en el caso dematrices de datos verticales.

Cada unidad muestral se mide en diferentes situaciones experimentales(codificada con un número en "id")

Cada fila del dataframe es una pseudo‐réplica de cada verdadero sujeto "id"Hay una sola medida de cada sujeto "id" en cada una de las situaciones experimentales

Vamos a utilizar la aproximación de modelos mixtos, con lmer{lme4}Definiremos en la parte aleatoria una estructura con (1|id)

Para su desarrollo y aplicación con unos datos de ejemplo, consultad:http://www.uni‐kiel.de/psychologie/rexrepos/posts/anovaMixed.html

y el script con explicaciones en:http://www.lmcarrascal.eu/cursos/glm6v.R

129

Page 130: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

A continuación se presenta la lógica de los diseños y sus nombres.Para más detalles sobre la estructura de estos modelos mixtos consultad las páginas 18‐69. 

CONSTRUIMOS LOS MODELOS (usando REML)Estos modelos asumen compound symmetry

Para facilitar la estima del modelo:mi.control <‐ lmerControl(check.conv.grad=.makeCC(action ="ignore", tol=1e‐6, relTol=NULL), optimizer="bobyqa", optCtrl=list(maxfun=100000))

En rojo se muestran las estructuras del término error aleatorio

MODELO NULO PARA LOS MODELOS CON ONE‐WAY WITHIN‐SUBJECTS DESIGNsolo entra el intercepto (1)modelo0 <- lmer(a_por_b ~ 1 + (1|id), data=datos, REML=TRUE, control=mi.control)

ONE‐WAY WITHIN‐SUBJECTS DESIGNun solo factor dentro‐de‐sujetos con cuatro niveles (tratamiento)con un solo factor dentro‐de‐sujetos solo necesitamos un término aleatorio: (1|id)modelo1 <- lmer(a_por_b ~ tratamiento + (1|id), data=datos, REML=TRUE, control=mi.control)

130

Page 131: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

ONE‐WAY WITHIN‐SUBJECTS ANCOVA DESIGN, WITH ONE FIXED COVARIATEun solo factor dentro‐de‐sujetos (tratamiento) con cuatro niveles y una covariante fija (volabdomen)modelo2 <- lmer(a_por_b ~ volabdomen+tratamiento + (1|id), data=datos,

REML=TRUE, control=mi.control)

ONE‐WAY WITHIN‐SUBJECTS ANCOVA DESIGN, WITH ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT CONSTANT SLOPE EFFECT)un solo factor dentro‐de‐sujetos (tratamiento) con cuatro niveles

y una covariante fija (volabdomen) y otra cambiante (t_sonda)tanto más correlación haya entre la covariante cambiante y los niveles del factor dentro‐de‐sujetos,

tanto más cambiarán los grados de libertad para el término error (Df.res ó DenDF)modelo31 <- lmer(a_por_b ~ volabdomen+t_sonda+tratamiento + (1|id), data=datos,

REML=TRUE, control=mi.control)

ONE‐WAY WITHIN‐SUBJECTS ANCOVA DESIGN, WITH ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT AND SLOPES EFFECTS)idem del anterior, pero establecemos que las pendientes de la covariante cambiante puedan variar a través de los niveles del factor dentro‐de‐sujetosmodelo32 <- lmer(a_por_b ~ volabdomen+t_sonda+tratamiento + (t_sonda|id),

data=datos, REML=TRUE, control=mi.control) 131

Page 132: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

TWO‐WAY SPLIT‐PLOT DESIGN, with ONE WITHIN‐SUBJECTS AND ONE BETWEEN‐SUBJECTS FACTORSun factor dentro‐de‐sujetos con cuatro niveles (tratamiento) y 

otro factor entre‐sujetos con 13 niveles (especie); este factor define el split‐plot designdefinimos el modelo con efectos principales e interacción entre factoresmodelo4 <- lmer(a_por_b ~ tratamiento*especie + (1|id), data=datos,

REML=TRUE, control=mi.control)

TWO‐WAY SPLIT‐PLOT ANCOVA DESIGN, with ONE WITHIN‐SUBJECTS AND ONE BETWEEN‐SUBJECTS FACTORS, PLUS ONE FIXED COVARIATEun factor dentro‐de‐sujetos con cuatro niveles (tratamiento) yotro factor entre‐sujetos con 13 niveles (especie) con efectos principales e interacción entre factores,y añadimos una covariante fija (volabdomen)modelo5 <- lmer(a_por_b ~ volabdomen+tratamiento*especie + (1|id), data=datos,

REML=TRUE, control=mi.control)

TWO‐WAY SPLIT‐PLOT ANCOVA DESIGN, with ONE WITHIN‐SUBJECTS AND ONE BETWEEN‐SUBJECTS FACTORS, PLUS ONE FIXED AND ONE CHANGING COVARIATESidem del anterior pero añadiendo una covariante cambiante (t_sonda) con random intercepttanto más correlación haya entre la covariante cambiante y los niveles del factor dentro‐de‐sujetos, tanto más cambiarán los grados de libertad para el término error (Df.res ó DenDF)modelo6 <- lmer(a_por_b ~ volabdomen+t_sonda+tratamiento*especie + (1|id), data=datos,

REML=TRUE, control=mi.control)132

Page 133: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

MODELO NULO PARA LOS MODELOS CON TWO‐WAY WITHIN‐SUBJECTS DESIGNScon dos factores dentro‐de‐sujetos, añadimos al término aleatorio (1|id) otros dos interacción sujeto:factor‐dentro‐de (1|factor:id), una por cada "factor dentro"

solo entra el intercepto (1)modelo00 <- lmer(a_por_b ~ 1 + (1|id)+(1|fuente:id)+(1|posicion:id), data=datos,

REML=TRUE, control=mi.control)

TWO‐WAY WITHIN‐SUBJECTS DESIGNdos factores dentro‐de‐sujetos con dos niveles cada uno (fuente y posicion)con efectos principales e interacción entre ambos factoresmodelo7 <- lmer(a_por_b ~ fuente*posicion + (1|id)+(1|fuente:id)+(1|posicion:id),

data=datos, REML=TRUE, control=mi.control)

TWO‐WAY WITHIN‐SUBJECTS DESIGN, with ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT CONSTANT SLOPE EFFECT)para más detalles sobre las covariantes consultad el modelo31modelo81 <- lmer(a_por_b ~ volabdomen+t_sonda+fuente*posicion + (1|id)+(1|fuente:id)+(1|posicion:id),

data=datos, REML=TRUE, control=mi.control)

133

Page 134: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

TWO‐WAY WITHIN‐SUBJECTS DESIGN, with ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT AND SLOPE EFFECTS)idem del anterior, pero establecemos que las pendientes de la covariante cambiante (t_sonda) puedan variar a través de los niveles del factor dentro‐de‐sujetospara más detalles sobre las covariantes consultad el modelo32modelo82 <- lmer(a_por_b ~ volabdomen+t_sonda+fuente*posicion +

(t_sonda|id)+(1|fuente:id)+(1|posicion:id), data=datos,REML=TRUE, control=mi.control)

THREE‐WAY SPLIT‐PLOT DESIGN, with TWO WITHIN‐SUBJECTS AND ONE BETWEEN‐SUBJECTS FACTORSdos factores dentro‐de‐sujetos con dos niveles cada uno (fuente y posicion), y otro factor

entre‐sujetos con 13 niveles (especie)con efectos principales e interacciones entre los tres factorescon dos factores dentro‐de‐sujetos, añadimos al término aleatorio (1|id) otros dos:interacción sujeto:factor‐dentro‐de (1|factor:id) solo para los factores dentro‐de‐sujetos

modelo9 <- lmer(a_por_b ~ fuente*posicion*especie + (1|id)+(1|fuente:id)+(1|posicion:id),data=datos, REML=TRUE, control=mi.control)

134

Page 135: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

THREE‐WAY SPLIT‐PLOT ANCOVA DESIGN, WITH ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT EFFECT)Idem del anterior modelo9 pero añadiendo dos covariantes, una fija (volabdomen) y otra cambiante (t_sonda) para la que se aplica un diseño de random intercept constant slopemodelo10 <- lmer(a_por_b ~ volabdomen+t_sonda+fuente*posicion*especie +

(1|id)+(1|fuente:id)+(1|posicion:id),data=datos, REML=TRUE, control=mi.control)

FOUR‐WAY SPLIT‐PLOT DESIGN CON EFECTOS ANIDADOSdos factores dentro‐de‐sujetos con dos niveles cada uno (fuente y posicion) y otros dos factores entre‐sujetos, 

uno con dos niveles (flightless) y otro con 13 niveles (especie) anidado dentro del anteriorcon efectos principales e interacción entre los dos factores dentro‐de‐sujetos, y efectos anidados en los dos factores entre‐sujetos

modeloXL1 <- lmer(a_por_b ~ fuente*posicion+flightless/especie +(1|id)+(1|fuente:id)+(1|posicion:id),data=datos, REML=TRUE, control=mi.control)

con efectos principales e interacción entre los cuatros factores,con el efecto anidado en los dos factores entre‐sujetos

modeloXL1 <- lmer(a_por_b ~ fuente*posicion*flightless/especie +(1|id)+(1|fuente:id)+(1|posicion:id),data=datos, REML=TRUE, control=mi.control)

135

Page 136: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

FOUR‐WAY SPLIT‐PLOT DESIGN, WITH ONE FIXED COVARIATE AND ONE CHANGING COVARIATE (WITH RANDOM INTERCEPT EFFECT)dos factores dentro‐de‐sujetos con dos niveles cada uno (fuente y posicion) y otros dos factor entre‐sujetos, 

uno con dos niveles (flightless) y otro con 13 niveles (especie) anidado dentro del anteriorañadimos una covariante fija (volabdomen) y otra cambiante (t_sonda)para la covariante cambiante asumimos un diseño random intercept constant slopetanto más correlación haya entre la covariante cambiante y los niveles del factor dentro‐de‐sujetos,

tanto más cambiarán los grados de libertad para el término error (Df.res ó DenDF)

modeloXXL <- lmer(a_por_b ~ volabdomen+t_sonda+fuente*posicion+flightless/especie +(1|id)+(1|fuente:id)+(1|posicion:id), data=datos, REML=TRUE, control=mi.control)

136

Page 137: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

COMPARACIÓN DE DOS MODELOS MEDIANTE AIC usando MLpara efectuar correctamente la comparación de dos modelos hay que actualizarlos usando Maximum Likelihood (ML) en vez de Restricted Estimation ML (REML)

ejemplos con modelos previosAICc(update(modelo1, REML=FALSE), update(modelo0, REML=FALSE))AICc(update(modelo10, REML=FALSE), update(modelo9, REML=FALSE))

TEST FRECUENTISTA PARA COMPARAR MODELOSlos modelos que se comparan deben de tener la misma parte aleatoriaponemos antes el modelo más complejo

ejemplos con modelos previosKRmodcomp(modelo1, modelo0)KRmodcomp(modelo10, modelo9)

137

Page 138: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

PARTICIÓN DE LA VARIANZAR2m: marginal R2 (the proportion of variance explained by the fixed factor(s) alone)R2c: conditional R2 (the proportion of variance explained by both the fixed and random

factors; i.e. the entire model)ejemplos con modelos previos

r.squaredGLMM(modelo0)r.squaredGLMM(modelo9)

TABLA SINTÉTICA DE EFECTOS PARCIALES Y SIGNIFICACIONES (PARA EFECTOS FIJOS)podemos trabajar con sumas de cuadrados de tipo‐III Anova(modelo9, type=3, test="F")en diseños n‐way complejos con muchas interacciones nos puede convenirhacer uso de SS de tipo‐II

Anova(modelo9, type=2, test="F")

SIGNIFICACIÓN DE LA PARTE ALEATORIA (DIFERENCIA ENTRE SUJETOS)rand(modelo9)

138

Page 139: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

ALGUNAS FIGURAS DE EFECTOS ATRIBUIBLES A LOS FACTORES(controlando por las covariantes)resultado gráfico con una figura y múltiples paneles; media +/‐ std_errorse proporcionan los valores ajustados por las covariantesejemplos con modelos previos

plot(interactionMeans(modelo), legend.margin=0.2)

PARTIAL RESIDUAL PLOTSEntrañan considerable dificultad en los modelos mixtos (lmer o glmer) por el hecho de

tener pseudo‐réplicas asignadas a los niveles de un factor aleatorio.Podemos optar por efectuar una estrategia aproximada para visualizar los efectos parciales

construimos un modelo NO‐MIXTO con los mismos efectos que los incluidos en lmer(...)excluyendo la parte aleatoria (1|...)

El siguiente comando crPlots{car} no admite interacciones entre los factoresformula(modelo) ## para ver cuál era la fórmula del modelomodgraf.noint <- lm(a_por_b ~ volabdomen+t_sonda+fuente+posicion+especie, data=datos)crPlots(modgraf.noint, smooth=FALSE, pch=15, lwd=2, col.lines="blue",

grid=FALSE, ylab="partial residuals", main="TITULA COMO QUIERAS")139

Page 140: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

140

Page 141: DISEÑOS n FACTORIALES COMPLEJOS - …lmcarrascal.eu/cursos/pres3.pdf · DISEÑOS n ‐FACTORIALES ... d.f.= 3, 3 NO UTILIZAMOS el término Residual ejemplo: DISEÑOS n ...

DISEÑOS n‐FACTORIALES DE EFECTOS “DENTRO” SUJETOSn way ANOVAS y MANOVASANOVAs de Medidas Repetidas ‐ SPLIT‐PLOT DESIGNS – matrices verticales

141