Modelos Mixtos en InfoStat

193
Modelos Mixtos en InfoStat Julio A. Di Rienzo Raúl Macchiavelli Fernando Casanoves Actualizado en Octubre de 2009

Transcript of Modelos Mixtos en InfoStat

Page 1: Modelos Mixtos en InfoStat

Modelos Mixtos en

InfoStat

Julio A. Di Rienzo

Raúl Macchiavelli

Fernando Casanoves

Actualizado en Octubre de 2009

Page 2: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

Julio A. Di Rienzo es Profesor Asociado de Estadística y

Biometría de la Facultad de Ciencias Agropecuarias de la

Universidad Nacional de Córdoba, Argentina. Director del

grupo de desarrollo de InfoStat y responsable de la

implementación de la interfase con R que se presenta en

esta obra ([email protected]).

Raúl E. Macchiavelli es Catedrático de Biometría en el

Facultad de Ciencias Agrícolas, Universidad de Puerto Rico

- Mayagüez ([email protected])

Fernando Casanoves es el Jefe de la Unidad de

Bioestadística del Centro Agronómico Tropical de

Investigación y Enseñanza (CATIE). Anteriormente trabajó

en la Facultad de Ciencias Agropecuarias de la Universidad

Nacional de Córdoba, Argentina, donde participó del

desarrollo de InfoStat ([email protected]).

Page 3: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

AGRADECIMIENTOS

Los autores agradecen a las Estadísticas Yuri Marcela García Saavedra y Jhenny Liliana

Salgado Vásquez, de la Universidad del Tolima, Colombia, por la lectura crítica del

manuscrito, la reproducción de la ejemplificación de este manual y los aportes sobre

algunos detalles de la interfaz.

Page 4: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

ii

INDICE DE CONTENIDOS

Introducción ................................................................................................................................1

Requerimientos (actualización 25/10/2009) .......................................................................1

Invocación del procedimiento de modelos lineales generales y mixtos ..................................2

Especificación de los efectos fijos...............................................................................................2

Especificación de los efectos aleatorios .....................................................................................5

Comparación de medias de tratamientos..................................................................................8

Especificación de la estructura de correlación y de varianza de los errores .........................9

Especificación de la estructura de correlación........................................................................ 10

Especificación de la parte fija .......................................................................................................... 12

Especificación de la parte aleatoria................................................................................................. 13

Especificación de la correlación de los errores ............................................................................... 14

Especificación de la estructura de varianzas de los errores .................................................... 18

Análisis de un modelo ajustado ...............................................................................................21

Ejemplos de Aplicación de Modelos Lineales Generales y Mixtos ......................................26

Estimación de componentes de varianza ................................................................................ 27

Aplicación de modelos mixtos para datos estratificados ........................................................ 49

Parcelas divididas ............................................................................................................................ 49

Parcelas divididas en un arreglo en bloques.................................................................................... 50

Parcelas divididas en un arreglo en diseño completamente aleatorizado........................................ 60

Parcelas subdivididas (split-split plot) ............................................................................................. 68

Aplicación de modelos mixtos para mediciones repetidas en el tiempo ................................ 77

Datos longitudinales......................................................................................................................... 77

Análisis de un ensayo de establecimiento de forrajeras ................................................................... 78

Análisis de un ensayo de drogas para asma..................................................................................... 96

Análisis de bolsas de descomposición ............................................................................................ 112

Uso de modelos mixtos para el control de la variabilidad espacial en ensayos agrícolas .... 125

Correlación espacial ...................................................................................................................... 125

Análisis de un ensayo comparativo de rendimientos en maní ........................................................ 126

Aplicaciones de modelos mixtos en otros diseños experimentales ...................................... 147

Diseño en franjas (strip-plot) ......................................................................................................... 147

Diseño experimental con dos factores y dependencia espacial ...................................................... 156

Diseños de testigos apareados........................................................................................................ 169

Referencias...............................................................................................................................181

Índice de cuadros ....................................................................................................................183

Índice de figuras......................................................................................................................183

Page 5: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

1

Introducción

InfoStat implementa una interfase amigable de la plataforma R para la estimación de

modelos lineales generales y mixtos a través de los procedimientos gls y lme de la

librería nlme. La bibliografía de referencia de esta implementación, así como alguno de

los ejemplos utilizados, corresponde a Pinheiro y Bates (2004). Las rutinas utilizadas

para vincular la plataforma de desarrollo de InfoStat (Delphi) con el DCOM-R (una

forma de correr R en el background) es un desarrollo de Dieter Menne

([email protected]).

Requerimientos (actualización 25/10/2009)

Para que InfoStat pueda tener acceso a R, debe estar instalado en su sistema el

componente DCOM y R. Para ello se deben seguir los siguientes pasos (EN ESE

ORDEN):

a. Desinstalar R si estuviera previamente instalado en su computadora.

b. Desinstalar DCOM si estuviera previamente instalado en su computadora

c. Reiniciar su computadora

d. Instalar DCOM DCOM 3.01B5

e. Reinstalar R R-2.9.2-win32

f. Correr R e instalar (desde los repositórios de R) la librería rscproxy

g. Salir de R – Instalación concluida

Nota: Si bien InfoStat se mantiene actualizado para las últimas versiones de DCOM y R, se recomienda utilizar las versiones que se pueden descargar de los vínculos (links) anteriores.

En algunas configuraciones de Windows Vista hay inconvenientes para instalar la

librería rscproxy. El síntoma es que cuando están instalando la librería, aparece un

diálogo de opciones (dos opciones). No importa la opción que Ud. elija la instalación

fallará. Solución: Entre al sitio del CRAN, busque y descargue manualmente el archivo

rscproxy zipeado. Descomprímalo y cópielo (o muévalo) al directorio

C:\Archio de Programas\R\R-2.9.0\library\.

Page 6: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

2

Invocación del procedimiento de modelos lineales generales y mixtos

En el menú Estadísticas seleccionar el submenú Modelos lineales generales y mixtos,

allí encontrará dos opciones. La primera, con el rótulo Estimación, invoca la ventana de

diálogo que permite especificar la estructura del modelo. La segunda, rotulada Análisis

–exploración de modelos estimados, se activa cuando algún modelo ha sido estimado

previamente y contiene un conjunto de herramientas para el análisis diagnóstico.

Especificación de los efectos fijos

Comenzaremos indicando cómo ajustar un modelo de efectos fijos, utilizando el archivo

Atriplex.IDB2 del conjunto de datos de prueba de InfoStat. Una vez abierto este archivo

activar el menú Estadísticas, submenú Modelos lineales mixtos, opción Estimación. En

la ventana de selección de variables, los factores de clasificación, covariables y

variables dependientes pueden ser especificados como en un análisis de la varianza para

efectos fijos. Para los datos en el archivo Atriplex.IDB2 especificar PG como variable

respuesta y como criterios de clasificación a Tamaño y Episperma. Una vez que se

acepta la selección realizada se mostrará la ventana principal de la interfase para

modelos mixtos. Esta ventana contiene cinco solapas (Figura 1).

Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto.

La primera permite especificar los efectos fijos del modelo y seleccionar opciones para

la presentación de resultados y la generación de predicciones, obtener residuos del

modelo y especificar el método de estimación. Por defecto el método de estimación es

máxima verosimilitud restringida (REML).

A la derecha de la ventana aparecerá una lista conteniendo las variables de clasificación

y las covariables declaradas en la ventana de selección de variables. Para incluir un

factor (variable de clasificación) o una covariable a la parte fija del modelo, basta hacer

doble clic sobre el nombre del factor o covariable que se quiere incluir. Esta acción

agregará una línea en la lista de efectos fijos. Doble clics adicionales sobre un factor o

una covariable agregarán términos en líneas sucesivas, implícitamente separados por un

signo “+” (modelo aditivo). Seleccionando con el ratón los factores principales y

Page 7: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

3

accionando el botón “*” se introduce un término que especifica la interacción entre los

factores. Para el conjunto de datos en el archivo Atriplex.IDB2, incluir en el modelo de

efectos fijos los factores Tamaño, Episperma y su interacción (Figura 2). Algunos de los

textos en estas ventanas han sido aumentados de tamaño para mejorar su visualización

(esto se logra moviendo el roller del ratón mientras la tecla Ctrl del teclado esta

apretada).

Si aceptamos esta especificación, en la ventana de resultados de InfoStat se obtendrá la

salida que se muestra a continuación de la Figura 2. La salida que se obtiene es la más

sencilla ya que no se han especificado características adicionales del modelo u otras

opciones de análisis. La primera parte contiene la especificación de la forma en que se

invocó la estimación del modelo en la sintaxis de R, e indica el nombre del objeto R que

contiene al modelo y su estimación. En este caso modelo001_PG_REML. Esta

especificación es sólo de interés para aquellos que están acostumbrados a ver las

sentencias en R.

La segunda parte muestra medidas de ajuste que son útiles para comparar distintos

modelos ajustados a un conjunto de datos. AIC hace referencia al criterio de Akaike,

BIC al Criterio Bayesiano de Información, logLik al logaritmo de la verosimilitud y

Sigma a la desviación estándar residual.

La tercera parte de esta salida presenta una tabla de análisis de la varianza mostrando las

pruebas de hipótesis de tipo secuencial.

Page 8: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

4

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2.

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_PG_REML<-gls(PG~1+Tamano+Episperma+Tamano:Episperma ,method="REML" ,na.action=na.omit ,data=R.data01) Resultados para el modelo: modelo001_PG_REML Variable dependiente:PG Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 27 160.36 169.26 -70.18 9.07 0.92 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1409.95 <0.0001 Tamano 2 10.49 0.0010 Episperma 2 90.53 <0.0001 Tamano:Episperma 4 2.29 0.0994

Page 9: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

5

Especificación de los efectos aleatorios

Los efectos aleatorios están asociados a grupos de observaciones. Ejemplos típicos son

las medidas repetidas sobre un mismo individuo o las respuestas observadas en grupos

de unidades experimentales homogéneas (bloques) o en los individuos de un mismo

grupo familiar, etc. Estos efectos aleatorios son “agregados” a los efectos fijos de

manera selectiva. Por lo tanto, en la especificación de los efectos aleatorios es necesario

tener uno o más criterios de agrupamiento o estratificación, y elegir sobre qué efectos

fijos se agregan los efectos aleatorios asociados. En el procedimiento lme de R, sobre el

que se basa esta implementación, cuando hay más de un criterio de agrupamiento

admisible, estos son anidados o encajados.

En la segunda solapa del diálogo de especificación del modelo podemos elegir los

criterios de estratificación o agrupamiento y la forma en que éstos incorporan efectos

aleatorios a los componentes fijos. Para ejemplificar la especificación de los efectos

aleatorios consideremos el archivo de prueba Bloque.IDB2. Este archivo contiene tres

columnas: Bloque, Tratamiento y Rendimiento. En este ejemplo indicaremos que los

bloques fueron seleccionados en forma aleatoria o producen un efecto aleatorio (por

ejemplo, si los bloques son conjuntos de parcelas, el efecto de estos puede ser

considerado aleatorio ya que su respuesta dependerá entre otras cosas de condiciones

ambientales que no son predecibles), mientras que los tratamientos agregan efectos

fijos. Para especificar este modelo, las dos primeras columnas del archivo de pruebas

Bloque.IDB2 (Bloque y Tratamiento) se ingresarán como criterios de clasificación y la

última (Rendimiento) como variable dependiente. El factor Tratamiento se incluirá en la

solapa Efectos fijos como el único componente de esa parte del modelo. Para agregar el

efecto aleatorio de los bloques, seleccionaremos la solapa Efectos aleatorios. Cuando se

selecciona ésta solapa la lista Criterios de estratificación está vacía. Haciendo doble clic

sobre Bloque en la lista de variables, se agrega éste factor de clasificación, como criterio

de agrupamiento. La inclusión de un criterio de estratificación activa, en el panel

inferior, un dispositivo que permite detallar la forma en que el efecto aleatorio entra en

el modelo. En éste dispositivo hay una lista de componentes de la parte fija de modelo.

El primer componente hace referencia a la Constante y el resto a los otros términos, en

este caso Tratamiento (Figura 3).

Page 10: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

6

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.

Dentro de la lista de términos fijos aparecen los criterios de estratificación previamente

especificados. La combinación de ambas listas define los efectos aleatorios. Para ello,

cada criterio de estratificación, dentro de cada efecto fijo, tiene asociado un check box.

Cuando éste está tildado indica que hay un conjunto de efectos aleatorios asociados al

efecto fijo correspondiente. El número de efectos aleatorios es igual al número de

niveles que tiene el término fijo del modelo o a 1 en el caso de la constante o de las

covariables. En el ejemplo que se ilustra se está incluyendo un efecto aleatorio inducido

por los bloques sobre la constante.

Esta especificación representa al siguiente modelo:

; 1,.., ; 1,...,ij i j ijy b i T j B (1)

donde ijy es la respuesta al i-ésimo tratamiento en el j-ésimo bloque, la media

general de rendimientos, i los efectos fijos de los tratamientos, jb el cambio del nivel

medio de ijy asociado al j-ésimo bloque y ij el término de error asociado a la

Page 11: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

7

observación ijy . T y B son el número de niveles del factor de clasificación

correspondiente al efecto fijo Tratamiento y al número de bloques respectivamente. Los

jb se consideran, a diferencia de un efecto fijo, como variables aleatorias idénticamente

distribuidas 20, bN y cuyas realizaciones se interpretan como los efectos de los

distintos grupos o estratos (bloques, en este ejemplo). Luego, en estos modelos, los jb

no se estiman, lo que se estima es el parámetro 2b que caracteriza a su distribución. Los

ij también se interpretan como variables aleatorias idénticamente distribuidas

20,N y describen a los errores aleatorios asociados a cada observación. Se supone,

además, que las variables aleatorias jb y ij son independientes.

La salida del ejemplo se muestra a continuación. La parte nueva de esta salida, respecto

del ejemplo con el modelo lineal de efectos fijos, es que tiene una sección de parámetros

para los efectos aleatorios.

Especificación del modelo en R modelo002_Rendimiento_REML<-lme(Rendimiento~1+Tratamiento ,random=list(Bloque=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data03 ,keep.data=FALSE) Resultados para el modelo: modelo003_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 20 218.77 223.73 -102.39 160.65 0.89 0.93 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 12 2240.00 <0.0001 Tratamiento 4 12 41.57 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.57

Page 12: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

8

En este caso se presenta la estimación de b (la desviación estándar de los jb relativa al

residual) como 0.57. Al comienzo de la salida puede observarse la estimación de , la

desviación estándar de los ij , como 160.65. Así, la varianza de los bloques puede

calcularse como: 2 2(0.57 160.65) 8385.15b

Comparación de medias de tratamientos

Siguiendo en la solapa Comparaciones (Figura 4), si en el panel que lista los términos

fijos del modelo se tilda alguno de ellos, se obtiene una tabla de medias y errores

estándares y una comparación múltiple entre medias del tipo LSD de Fisher (esta prueba

está basada en una prueba de Wald) o la prueba de formación de grupos excluyentes

DGC (Di Rienzo et ál. 2002). También se presentan varias opciones de corrección por

comparaciones múltiples.

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2.

Page 13: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

9

La salida correspondiente a la comparación de las medias de tratamientos se presenta a

continuación.

Medias ajustadas y errores estándares para Tratamiento LSD Fisher (alfa=0.05) Procedimiento de corrección de p-valores: No Tratamiento Medias E.E. 300 3237.75 92.47 A 225 3093.50 92.47 A B 150 2973.00 92.47 B 75 2498.50 92.47 C 0 1972.75 92.47 D Letras distintas indican diferencias significativas(p<= 0.05)

La comparación de medias de tratamientos se muestra de la forma clásica como una

lista ordenada en forma decreciente.

Si el usuario desea controlar el error tipo I para la familia de todas las comparaciones de

a pares, puede optar por alguno de los cuatro criterios implementados: Bonferroni (Hsu

199), Sidak (Hsu 1996), Benjamini-Hochberg (Benjamini y Hochberg 1995) o

Benjamini-Yekutieli (Benjamini y Yekutieli 2001). Si para este mismo conjunto de

datos se selecciona la opción Bonferroni, se obtiene el siguiente resultado:

Medias ajustadas y errores estándares para Tratamiento LSD Fisher (alfa=0.05) Procedimiento de corrección de p-valores: Bonferroni Tratamiento Medias E.E. 300 3237.75 92.47 A 225 3093.50 92.47 A B 150 2973.00 92.47 A B 75 2498.50 92.47 B 0 1972.75 92.47 B Letras distintas indican diferencias significativas(p<= 0.05)

Especificación de la estructura de correlación y de varianza de los errores

Las estructuras de varianzas y de covarianzas pueden modelarse separadamente. Para

ello, InfoStat presenta dos solapas: en la solapa Correlación se encuentran las opciones

para especificar la estructura de correlación de los errores y la solapa

Heteroscedasticidad permite seleccionar distintos modelos para la función de varianza.

A continuación se describen los contenidos de estas solapas.

Page 14: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

10

Especificación de la estructura de correlación

Para ejemplificar la utilización de esta herramienta recurriremos a un ejemplo citado en

Pinheiro y Bates (2004). Corresponde al archivo “Ovary” que contiene los datos de un

estudio de Pierson y Ginther (1987) sobre el número de folículos mayores de 10 mm en

ovarios de yeguas (mare). Estos números se registraron a los largo del tiempo desde 3

días antes de la ovulación y hasta 3 días después de la próxima ovulación. Los datos

pueden cargarse desde la librería nlme utilizando el ítem de menú Aplicaciones>>Data

set de R. Cuando se activa esta opción aparece la siguiente ventana de diálogo, que

puede diferir en el número de librerías que estén instaladas en su configuración local de

R (Figura 5).

Figura 5: Ventana de diálogo para importar datos desde las librerías de R.

En ella se muestra tildada la librería nlme y a la derecha la lista de archivos de datos en

esa librería. Haciendo doble clic sobre “Ovary, nlme” se abrirá una tabla de datos de

InfoStat conteniendo los datos correspondientes. El encabezamiento de la tabla abierta

se muestra a continuación (Figura 6).

Page 15: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

11

Figura 6: Encabezamiento de la tabla de datos del archivo Ovary.

Una gráfica de la relación entre número de folículos y el tiempo se muestra a

continuación (Figura 7).

-0,25 0,00 0,25 0,50 0,75 1,00 1,25

Time

0

5

10

15

20

25

Fo

llicl

es

Figura 7: Relación entre el número de folículos (follicles) y el tiempo (Time).

Pinheiro y Bates (2004) proponen ajustar un modelo donde el número de folículos

depende linealmente del seno(2*pi*Time) y el coseno(2*pi*Time). Este modelo trata de

reflejar las variaciones cíclicas del número de folículos mediante la inclusión de

funciones trigonométricas. Además proponen la inclusión de un efecto aleatorio de

yegua (Mare) sobre la constante del modelo y una auto-correlación de orden 1 de los

errores dentro de cada hembra. El efecto aleatorio se incluyó para romper con la falta de

independencia debida a efectos sujeto-dependientes que se expresan como perfiles

Page 16: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

12

paralelos del número de folículos a través del tiempo. El modelo propuesto tendría la

siguiente forma general:

0 1 2 02* * 2* *iTime i ity sin pi Time cos pi Time b (2)

donde los componentes aleatorios son 20 ~ 0,i bob N y 2~ 0,it N .

Por otra parte, la inclusión de una auto-correlación de orden 1 AR1 dentro de cada

yegua tiene como propósito modelar una eventual correlación serial. Para especificar

este modelo en InfoStat, indicaremos que follicles es la variable dependiente, que Mare

es un criterio de clasificación y que Time es una covariable.

Especificación de la parte fija

La parte fija del modelo quedará indicada como se muestra en la Figura 8. InfoStat

verifica que los elementos en esta ventana se corresponden con los factores y

covariables listados en la parte derecha de la ventana.

Figura 8: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary.

Page 17: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

13

Si no es así, porque no se han respetado minúsculas y mayúsculas (R es sensible a la

tipografía), entonces InfoStat substituye eso términos por los apropiados. Pero si aún

así, hay palabras que InfoStat no puede interpretar (como en este caso sin, cos y pi),

entonces la línea queda marcada en rojo. Esto no quiere decir que esté incorrecta sino

que puede estarlo y advierte al usuario para que la verifique.

Especificación de la parte aleatoria

La parte aleatoria se indica agregando a la lista de criterios de estratificación el factor

Mare y especificando que el efecto yegua (Mare) es sobre la constante. Esto se indica

tildando Mare dentro de Constante como se muestra en la Figura 9 (este tildado se

agrega por defecto). Los términos sin(2*pi*Time) y cos(2*pi*Time) no presentan, en

este caso, efectos aleatorios asociados.

Figura 9: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary.

Page 18: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

14

Especificación de la correlación de los errores

La especificación de la correlación autorregresiva de orden 1 para los errores dentro de

cada hembra, se indica en la solapa Correlación 1 como se ilustra en la Figura 10. En R

hay dos grupos de modelos de correlación. El primero corresponde a modelos de

correlación serial, donde se supone que los datos están ordenados en una secuencia, y el

segundo grupo modela correlaciones espaciales. En el primer grupo encontramos los

modelos de simetría compuesta, sin estructura, autorregresivo de orden 1,

autorregresivo continuo de orden 1 y el modelo ARMA(p,q), donde p indica el número

de términos autorregresivos y q el número de términos de medias móviles (moving

average). Todos estos modelos suponen que los datos están ordenados en una

secuencia. Por defecto, InfoStat asume la secuencia en la que los datos están dispuestos

en el archivo, pero si existe una variable que los ordena de manera diferente, ésta debe

indicarse en el casillero Variable que indica el orden de las observaciones (para que

este casillero se active hay que seleccionar alguna de las estructuras de correlación).

Esta variable debe ser entera para la opción autorregresiva. Por este motivo, InfoStat

agrega en la sentencia traducida al lenguaje R, una indicación para que la variable sea

interpretada como entera. En el ejemplo que estamos ilustrando, la variable Time es un

número real que codifica el tiempo relativo a un punto de referencia y está en una escala

inapropiada para usarla como criterio de ordenamiento. Sin embargo, como los datos

están ordenados por tiempo dentro de cada yegua (Mare), esta especificación puede

omitirse (Figura 10).

1 Si los errores se suponen independientes (no correlacionados), entonces debe seleccionarse la primera

opción de la lista de estructura de correlación (seleccionada por defecto).

Page 19: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

15

Figura 10: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary.

Si los datos no estuvieran ordenados en forma ascendente dentro del criterio de

agrupamiento (Mare), habría que agregar una variable que identifique el orden. Para

agregar una variable de ordenamiento su nombre puede escribirse o arrastrarse con el

ratón desde la lista de variables, al casillero correspondiente. Es usual que la estructura

de correlación esté asociada a un criterio de agrupamiento, en este caso Mare. Esto se

indica en el panel rotulado Criterios de agrupamiento (para que este casillero se active

hay que seleccionar alguna de las estructuras de correlación). Si se incluye más de un

criterio, InfoStat construye tantos grupos como combinación de niveles en los factores

de clasificación que se especifiquen. En la parte inferior de la ventana, rotulada

Expresión resultante, se muestra la expresión R que se está especificando para la

componente “corr=” de gls o lme. Esta expresión es sólo informativa y no puede

editarse.

Page 20: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

16

A continuación se presenta la salida completa del modelo ajustado conteniendo la tabla

de análisis de la varianza de los efectos fijos, que en este caso son pruebas sobre la

pendiente asociada a las covariables sin(2*pi*Time) y cos(2*pi*Time). A continuación,

se observa que la desviación estándar del componente aleatorio de la ordenada al origen

es 0.77 veces la desviación estándar residual y que el parámetro phi del modelo

autorregresivo es 0.61.

Modelos lineales generales y mixtos Especificación del modelo en R Modelo000_follicles_REML<-lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time) ,random=list(Mare= pdIdent(~1)) ,correlation=corAR1(form=~1|Mare) ,method="REML" ,na.action=na.omit ,data=R.data2 ,keep.data=FALSE) Variable dependiente:follicles Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 308 1562.45 1584.77 -775.22 3.67 0.21 0.56 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 295 163,29 <0,0001 sin(2 * pi * Time) 1 295 34,39 <0,0001 cos(2 * pi * Time) 1 295 2,94 0,0877 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Mare Desvíos estándares relativos al residual y correlaciones (Const) (Const) 0.77 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ 1 | Mare Parámetros del modelo Estimación Phi 0.61

Page 21: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

17

Los valores predichos por el modelo ajustado anteriormente versus el tiempo se

presentan en la Figura 11. La línea de trazo negro representa la estimación del promedio

poblacional y corresponde a la parte fija del modelo. Las curvas paralelas a esta son las

predicciones para cada yegua derivadas de la inclusión de un efecto aleatorio (sujeto

específico) sobre la constante. La inclusión de errores correlacionados según un modelo

autorregresivo de orden 1 tuvo por objeto (según nuestra interpretación) contemplar la

falta de independencia generada por el alejamiento de la curva de folículos de cada

yegua respecto de las curvas de folículos que se generan permitiendo una variación

sujeto-específica solo para la constante. Las discrepancias respecto del modelo que

incluye solo desviaciones sujeto-específicas para la constante pueden visualizarse

ajustando un modelo con efectos aleatorios sobre todos los parámetros de la parte fija

(Figura 12).

Poblacional Mare 01 Mare 02

Mare 03 Mare 04 Mare 05

Mare 06 Mare 07 Mare 08

Mare 09 Mare 10 Mare 11

-0,30 0,10 0,50 0,90 1,30

Time

2

7

12

17

22

folli

cle

s

Poblacional Mare 01 Mare 02

Mare 03 Mare 04 Mare 05

Mare 06 Mare 07 Mare 08

Mare 09 Mare 10 Mare 11

Figura 11: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para cada yegua originada por el efecto aleatorio sobre la constante (archivo Ovary).

Page 22: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

18

-0,30 0,10 0,50 0,90 1,30

Time

2

6

10

14

18

22

folli

cle

s

Figura 12: Funciones ajustadas para el número de folículos para cada yegua originada por la inclusión de efectos aleatorios sobre todos los parámetros de la parte fija del modelo (archivo Ovary).

Especificación de la estructura de varianzas de los errores

Este módulo permite contemplar modelos heteroscedásticos. La heteroscedasticidad sin

embargo no tiene un origen único y así como se modela la correlación entre los errores,

la heteroscedasticidad también puede modelarse. El modelo para las varianzas de los

errores se puede especificar de la siguiente manera: 2 2var( ) ( , , )i i ig z δ donde (.)g

se conoce como función de varianza. Esta función puede depender de la esperanza

( )i de iY (la variable de respuesta), de un conjunto de covariables iz y de un vector

de parámetros δ . InfoStat, a través de R, estima los parámetros δ de acuerdo a la

función de varianza seleccionada. La solapa Heteroscedasticidad se muestra en la

Figura 13. Las funciones de varianza admitidas pueden ser identidad (varIdent),

exponencial (varExp), potencia (varPower), potencia corrida por una constante

(varConstPower), o fija (varFixed). R admite que varios modelos de varianza puedan

superponerse, es decir, que para ciertos grupos de datos la varianza puede estar asociada

con alguna covariable y para otros con otra. La especificación simultánea de varios

Page 23: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

19

modelos para la función de varianza se obtiene, simplemente, marcando y especificando

cada uno de los componentes y agregándolos a la listas de funciones de varianza.

InfoStat arma la sentencia apropiada para R.

En la solapa Heteroscedasticidad para el ejemplo de los folículos, hemos indicado que

la varianza de los errores es distinta para cada yegua, seleccionando varIdent como

modelo de la función de varianza y escribiendo Mare en Criterios de agrupamiento.

Figura 13: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary.

A continuación se presenta la salida del ajuste incluyendo estimaciones de la desviación

estándar del error para cada yegua. También aquí las desviaciones estándar están

expresadas en términos relativos a la desviación estándar residual. Además, el primer

nivel del criterio de agrupamiento especificado para calcular estas desviaciones estándar

diferenciales, es siempre inicializado en 1 porque de otra forma el modelo no es

identificable. En la salida se observa que la hembra 5 tiene una variabilidad en el

número de folículos comparativamente mayor que las otras hembras.

Page 24: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

20

El modelo para estos datos sería:

0 1 2 02* * 2* *iTime i ity sin pi Time cos pi Time b (3)

donde los componentes aleatorios son 20 ~ 0,i bob N y 2~ 0,it iN .

Obsérvese que la varianza residual está sub-indicada con el índice que identifica a las

yeguas.

Como es usual, los componentes aleatorios del modelo se suponen independientes.

Luego si tomamos una yegua al azar la varianza de la respuesta sería la suma de las

varianzas de la parte aleatoria, es decir 2 20var( )iTime b iy , o sea (3.57*0.8)2 +

(3.57*gi)2, donde gi es la función de varianza para una yegua elegida aleatoriamente.

Ahora bien, cuando se condiciona a una yegua dada (por ejemplo la 5), el efecto

individuo ( 0ib ) está fijado, así que la varianza de la yegua 5 solo está asociada a la parte

residual y además la función de varianza queda especificada, (es decir, hay que usar g5)

y la varianza sería (3.57*1.34)2.

Modelos lineales generales y mixtos Especificación del modelo en R Modelo001_follicles_REML<-lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time) ,random=list(Mare= pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Mare)) ,correlation=corAR1(form=~1|Mare) ,method="REML" ,na.action=na.omit ,data=R.data5 ,keep.data=FALSE) Variable dependiente:follicles Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 308 1569.02 1628.55 -768.51 3.57 0.21 0.56 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 295 156.36 <0.0001 sin(2 * pi * Time) 1 295 34.22 <0.0001 cos(2 * pi * Time) 1 295 3.18 0.0756

Page 25: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

21

Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Mare Desvíos estándares relativos al residual y correlaciones (Const) (Const) 0.80 Estructura de correlación Modelo de correlacion: AR(1) Formula: ~ 1 | Mare Parámetros del modelo Estimación Phi 0.61 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Mare Parámetros del modelo Parámetro Estim 1 1.00 2 1.01 3 1.20 4 0.82 5 1.34 6 1.05 7 0.92 8 1.06 9 0.93 10 0.99 11 0.77

Análisis de un modelo ajustado

Cuando InfoStat ajusta un modelo lineal general o mixto con el menú Estimación, se

activa el menú Análisis-exploración de modelos estimados. En este diálogo aparecen

varias solapas como se muestra en la Figura 14.

Page 26: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

22

Figura 14: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada (archivo Atriplex.IDB2).

El ejemplo usado en este caso es el del archivo Atriplex.IDB2, sobre el que se estimaron

2 modelos de efectos fijos, el modelo000_PG_REML que contiene los efectos Tamaño,

Episperma y su interacción, y el modelo001_PG_REML que solo contiene los efectos

principales de Tamaño y Episperma.

La solapa Modelos sólo aparece en el caso que haya más de un modelo estimado y

presenta una lista de los modelos evaluados en un “check-list”. Los modelos tildados,

aparecen en una lista con sus estadísticos resumen y una prueba de hipótesis de igualdad

de modelo cuya aplicabilidad debe tomarse con cautela ya que no todos los modelos son

estrictamente comparables. De todas formas los criterios AIC y BIC son buenos

indicadores para seleccionar el modelo más parsimonioso.

La solapa Combinaciones lineales tiene como propósito probar hipótesis sobre

combinaciones lineales. La hipótesis que se prueba es que la esperanza de la

combinación lineal es cero. En esta ventana de diálogo aparecen listados los parámetros

fijos del modelo que se haya seleccionado de la lista que aparece en la parte derecha de

Page 27: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

23

la pantalla (Importante: por defecto siempre está seleccionado el último de la lista). En

la parte inferior de la pantalla hay un campo de edición donde pueden especificarse las

constantes de la combinación lineal. A medida que los coeficientes se van agregando,

los parámetros correspondientes se van coloreando para facilitar la especificación de las

constantes, como se ilustra en la Figura 15.

Figura 15: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales desplegada (archivo Atriplex.IDB2).

Finalmente la solapa Diagnóstico tiene 3 subsolapas (Figura 14). La primera,

identificada como “Residuos vs…” tiene dispositivos que sirven para generar de manera

sencilla gráficos del tipo boxplot para los residuos estandarizados vs. cada uno de los

factores fijos del modelo o diagramas de dispersión entre los residuos estandarizados y

las covariables del modelo o los valores predichos. Asimismo, es posible obtener el

gráfico QQ-plot normal. La segunda solapa, identificada como “ACF-SV”, permite

generar un gráfico de la función de auto-correlación (útil para el diagnóstico de

correlaciones seriales) y la tercera, identificada como LevelPlot, permite generar

gráficos de residuos vs. coordenadas espaciales para generar un mapa del sentido e

Page 28: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

24

intensidad de los residuos. Esta herramienta es útil en el diagnóstico de estructuras de

correlación espacial.

Para ejemplificar el uso de la solapa ACF-FV consideremos el ejemplo de los folículos

(archivo Ovary). En este ejemplo se argumentó que la inclusión del término

autorregresivo de orden 1 tenía por objeto corregir una falta de independencia generada

por las discrepancias entre los ciclos individuales de cada yegua respecto de los ciclos

individuales que solo diferían del ciclo promedio poblacional por una constante (Figura

11). El gráfico de la autocorrelación serial de los residuos correspondiente a un modelo

sin la inclusión de la autocorrelación de orden 1 muestra un claro patrón autorregresivo

(Figura 16). Por otra parte, el gráfico de la autocorrelación de los residuos para el

modelo que contempla la autocorrelación mediante un término autorregresivo de orden

1, corrige la falta de independencia (Figura 17).

Lag

Au

toco

rre

latio

n

-0.2

0.0

0.2

0.4

0.6

0.8

0 5 10

Figura 16: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) excluyendo la modelación de la autocorrelación serial.

Page 29: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

25

Lag

Au

toco

rre

latio

n

-0.2

0.0

0.2

0.4

0.6

0.8

0 5 10

Figura 17: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) incluyendo la modelación de la autocorrelación serial.

Las facilidades de la solapa Diagnóstico tienen por propósito permitir al investigador un

rápido diagnóstico de los eventuales problemas de adecuación tanto de la parte fija

como aleatoria del modelo ajustado. En la presentación de ejemplos se ilustrará más

extensamente el uso de estas herramientas.

Page 30: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

Ejemplos de Aplicación de Modelos Lineales Generales y Mixtos

Page 31: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

Estimación de componentes de varianza

En áreas como el mejoramiento genético animal o vegetal es de particular interés el

cálculo de componentes de varianza. Estos son usados para obtener heredabilidades,

respuesta a la selección, coeficientes de variabilidad genética aditiva, coeficientes de

diferenciación genética, etc. Los modelos lineales mixtos pueden usarse para estimar los

componentes de varianza, por medio del estimador de máxima verosimilitud restringida

(REML).

En muchos estudios de genética de poblaciones se trabaja con varias poblaciones que a

su vez están representadas por uno o más individuos de distintas familias. En este caso

se cuenta con dos factores en el modelo, las poblaciones y las familias dentro de cada

población. Para ejemplificar el uso de componentes de varianza se usan los datos que se

presentan en el archivo Compvar.IDB2 (Navarro et ál. 2005). Estos datos provienen de

un ensayo de siete poblaciones de cedro (Cedrela odorata L.) con un total de 115

familias. Para algunas familias se cuenta con repeticiones y para otras no. Además, el

número de familias dentro de cada población no es el mismo. Las variables registradas

son el largo promedio de las semillas (largo), el diámetro, el largo del tallo y número de

hojas de plantines de cedro.

Además de estimar los componentes de varianza, los investigadores están también

interesados en comparar las medias de las poblaciones. Podemos considerar varios

espacios de inferencia, de acuerdo al diseño y a los intereses de los investigadores. Si

las poblaciones son una muestra aleatoria de un conjunto grande de poblaciones,

entonces la inferencia estará orientada a este conjunto grande de poblaciones. El efecto

de las poblaciones estudiadas es aleatorio, y el interés será la estimación de los

componentes de varianza debida a poblaciones y a familias dentro de poblaciones. Otro

aspecto de interés serán los predictores BLUP de los efectos aleatorios (en especial los

de poblaciones).

Si la inferencia se orienta solamente a las poblaciones estudiadas, el efecto de población

es fijo, y el interés principal es estimar y comparar las medias de poblaciones. Si la

media de una población se interpreta como un promedio a través de todas las posibles

familias de dicha población (no solamente las estudiadas), entonces el efecto de familia

Page 32: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

28

es aleatorio. En este caso interesará estimar el componente de varianza debido a familia

dentro de poblaciones, y predecir los efectos de las familias estudiadas (BLUP).

Un tercer espacio de inferencia es cuando el interés reside solamente en las poblaciones

y las familias estudiadas. En este caso ambos efectos son fijos. Este tipo de modelo

presenta severas limitaciones, tanto en su interpretación como en su implementación.

Debido a esto, este modelo no se considerará en este tutorial.

Para el análisis de los datos del archivo Compvar.IDB2 se ajustarán los dos primeros

casos discutidos:

Modelo 1: Poblaciones aleatorias y familias aleatorias

Modelo 2: Poblaciones fijas y familias aleatorias

Primero se selecciona el menú Estadísticas, submenú Modelos lineales generales y

mixtos y escogemos Estimación. Al realizar esta selección aparecerá la ventana de

selección de variables, donde especificamos como variables dependientes a Largo,

Diametro, Largodetallo y Numerodehojas y como criterios de clasificación a Población

y Familia (Figura 18).

Figura 18: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Compvar.IDB2.

Page 33: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

29

Modelo 1: Para el cálculo de los componentes de varianza se deben especificar las

variables como en la Figura 18. Posteriormente, en la solapa Efectos aleatorios se debe

declarar primero a Población y luego a Familia, ya que R asume que las distintas

componentes aleatorias que se van agregando secuencialmente están anidadas en los

factores declarados con anterioridad. En la subventana Mostrar se tildaron las opciones

que se muestran en la Figura 19, y se sacó el tilde que tiene por defecto para presentar

los Desvíos estándares relativos al desvío estándar residual.

Figura 19: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 1.

En la solapa Efectos fijos no debe aparecer ningún efecto, y el método de estimación

debe ser el de máxima verosimilitud restringida (REML), que es la opción por defecto.

Observar que se desactivó la opción por defecto Desvíos estándares relativos al desvío

estándar residual, por lo que las estimaciones que aparecen serán directamente los

desvíos estándares absolutos. A continuación se presenta la salida obtenida con estas

especificaciones solo para la variable Largo.

Page 34: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

30

Modelos lineales generales y mixtos

Especificación del modelo en R modelo000_Largo_REML<-lme(Largo~1 ,random=list(Poblacion=pdIdent(~1) ,Familia=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 214 2016.47 2029.91 -1004.23 21.53 0.51 0.76 AIC y BIC menores implica mejor Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Poblacion Desvíos estándares y correlaciones (const) (const) 27.16 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Familia dentro de Poblacion Desvíos estándares y correlaciones (const) (const) 14.80 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~1|Poblacion LI(95%) Est. LS(95%) sd(const) 15.09 27.16 48.89 Formula: ~1|Familia dentro de Poblacion LI(95%) Est. LS(95%) sd(const) 10.72 14.80 20.43 Intervalo de confianza (95%) para sigma lower est. upper sigma 18.77 21.53 24.70

Page 35: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

31

A partir de las estimaciones de desvíos e intervalos de confianza para los desvíos, se

obtienen las componentes de varianza y sus intervalos de confianza (Cuadro 1).

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2

Componente Varianza estimada IC para la varianza

Variabilidad relativa al total

(%)

Población 2 227.16 737.66pob 2 2(15.09 ,48.88 ) 52.0

Familia dentro de población

2 2( ) 14.80 219.04fam pob 2 2(10.72 ,20.43 ) 15.4

Residual 2 221.53 463.54res 2 2(18.77 ,24.70 ) 32.6

De acuerdo a los resultados presentados en la tabla anterior, es interesante resaltar que

la variabilidad de la familias dentro de poblaciones es menor que la variabilidad residual

con lo cual no hay una diferenciación de familias dentro de poblaciones. La mayor

variación, en tanto, es atribuible a diferencias entre poblaciones.

Ahora veremos cómo es el diagnóstico para el Modelo 1, es decir, tanto los efectos de

familia como los de población aleatorios. Para esto vamos al submenú Análisis-

exploración de modelos estimados y se solicitan los gráficos de diagnóstico (Figura 20).

El análisis diagnóstico de este modelo permite determinar una fuerte falta de

homogeneidad de varianzas residual (Figura 21).

Page 36: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

32

Figura 20: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo 1 con los datos del archivo Compvar.IDB2.

20 40 60 80

-2-1

01

2

fitted(modeloLargocm_7_REML,level=2)

Re

s.co

nd

.est

an

d.P

ea

rso

n

-3 -2 -1 0 1 2 3

-2-1

01

2

Cuantiles teóricos

Cu

an

tile

s m

ue

stra

les

Figura 21: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del archivo Compvar.IDB2.

Page 37: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

33

En la figura anterior los residuos estandarizados de Pearsons son aproximaciones de

errores y por lo tanto la heteroscedasticidad observada de modelarse a este nivel.

Para corregir la falta de homogeneidad a este nivel se considera el Modelo 1 (Población

y Familia como factores aleatorios) con varianzas residuales heterogéneas. Para

incorporar las varianzas residuales eventualmente distintas para cada nivel de

Población, en la solapa heterogeneidad se debe especificar el factor población como se

muestra en la Figura 22.

Figura 22: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la especificación de varianzas heterogéneas para poblaciones.

A continuación se presenta la salida para el Modelo 1 con varianzas residuales

heterogéneas por Población y tildando en la solapa de Efectos aleatorios la opción

Matriz de efectos aleatorios para obtener los estimadores BLUP.

Page 38: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

34

Modelos lineales generales y mixtos Especificación del modelo en R modelo004_Largo_REML<-lme(Largo~1 ,random=list(Poblacion=pdIdent(~1) ,Familia=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Poblacion)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo002_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 214 1872.14 1905.75 -926.07 2.32 0.51 0.51 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 21.59 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Poblacion Desvíos estándares y correlaciones (const) (const) 27.72 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Familia dentro de Poblacion Desvíos estándares y correlaciones (const) (const) 1.56 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~1|Poblacion LI(95%) Est. LS(95%) sd(const) 15.61 27.72 49.24 Formula: ~1|Familia dentro de Poblacion LI(95%) Est. LS(95%) sd(const) 0.47 1.56 5.14

Page 39: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

35

Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Poblacion Parámetros de la función de varianza Parámetro Estim Charagre 1.00 Escarcega 13.09 Esclavos 11.64 La Paz 15.94 Pacífico Sur 2.81 Xpujil 13.38 Yucatán 12.54 Coeficientes (BLUP) de los efectos aleatorios (~1|Poblacion) const Charagre -41.20 Escarcega 15.42 Esclavos 16.12 La Paz 19.80 Pacífico Sur -36.51 Xpujil 23.29 Yucatán 3.08 Coeficientes (BLUP) de los efectos aleatorios (~1|Familia in Poblacion) const Charagre/Ch_71 -1.07 Charagre/Ch_710 0.59 Charagre/Ch_711 1.31 Charagre/Ch_712 1.42 Charagre/Ch_713 -0.95 Charagre/Ch_714 -1.07 Charagre/Ch_715 -0.70 Charagre/Ch_72 0.70 Charagre/Ch_73 -0.83 Charagre/Ch_74 -0.35 Charagre/Ch_75 -0.59 Charagre/Ch_76 -0.08 Charagre/Ch_77 -0.47 Charagre/Ch_78 0.48 Charagre/Ch_79 1.48 Escarcega/Es_1126 7.2E-04 Escarcega/Es_1127 0.18 Escarcega/Es_1128 0.14 Escarcega/Es_1129 0.07 Escarcega/Es_1130 3.6E-04 Escarcega/Es_1131 -0.06 Escarcega/Es_1132 0.21 Escarcega/Es_1133 0.01 Escarcega/Es_1134 -0.11 Escarcega/Es_1135 -0.09 Escarcega/Es_1136 -0.08 Escarcega/Es_1137 -0.17

Page 40: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

36

Escarcega/Es_1138 0.16 Escarcega/Es_1139 -0.08 Escarcega/Es_1142 0.08 Escarcega/Es_1148 -0.20 Esclavos/Ec_31 -0.08 Esclavos/Ec_310 0.08 Esclavos/Ec_311 -0.07 Esclavos/Ec_312 -0.03 Esclavos/Ec_313 -0.22 Esclavos/Ec_314 0.28 Esclavos/Ec_315 -0.34 Esclavos/Ec_316 0.15 Esclavos/Ec_317 0.04 Esclavos/Ec_318 -0.08 Esclavos/Ec_319 0.04 Esclavos/Ec_32 -0.07 Esclavos/Ec_320 0.18 Esclavos/Ec_33 -3.7E-03 Esclavos/Ec_34 -0.11 Esclavos/Ec_35 0.15 Esclavos/Ec_36 -0.17 Esclavos/Ec_37 0.18 Esclavos/Ec_38 0.08 Esclavos/Ec_39 0.05 La Paz/LP_41 -0.13 La Paz/LP_410 0.14 La Paz/LP_411 0.11 La Paz/LP_412 0.16 La Paz/LP_413 -0.08 La Paz/LP_414 -0.01 La Paz/LP_415 -0.13 La Paz/LP_42 0.01 La Paz/LP_43 -0.01 La Paz/LP_44 -0.01 La Paz/LP_45 0.02 La Paz/LP_46 -0.07 La Paz/LP_48 -0.01 La Paz/LP_49 0.07 Pacífico Sur/PS_6204 -0.46 Pacífico Sur/PS_6206 -0.58 Pacífico Sur/PS_6207 0.52 Pacífico Sur/PS_6208 -0.33 Pacífico Sur/PS_6209 -0.15 Pacífico Sur/PS_6210 0.31 Pacífico Sur/PS_6211 -0.22 Pacífico Sur/PS_6212 -0.43 Pacífico Sur/PS_6213 0.03 Pacífico Sur/PS_6214 -0.56 Pacífico Sur/PS_6215 -0.07 Pacífico Sur/PS_6216 1.80 Pacífico Sur/PS_6217 -0.12 Pacífico Sur/PS_6218 0.88 Pacífico Sur/PS_6219 -0.35 Pacífico Sur/PS_6220 -0.51 Pacífico Sur/PS_6221 -0.12 Pacífico Sur/PS_6222 -0.48 Pacífico Sur/PS_660 0.72 Xpujil/Xp_11 -0.12 Xpujil/Xp_110 0.02 Xpujil/Xp_112 3.8E-03 Xpujil/Xp_113 -0.07

Page 41: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

37

Xpujil/Xp_114 0.02 Xpujil/Xp_115 -0.12 Xpujil/Xp_116 0.17 Xpujil/Xp_117 0.11 Xpujil/Xp_118 0.08 Xpujil/Xp_119 0.18 Xpujil/Xp_12 -0.01 Xpujil/Xp_120 0.19 Xpujil/Xp_122 -0.21 Xpujil/Xp_123 -0.27 Xpujil/Xp_15 0.02 Xpujil/Xp_16 0.03 Xpujil/Xp_17 0.03 Xpujil/Xp_18 -0.05 Xpujil/Xp_19 0.07 Yucatán/Yu_1111 -0.17 Yucatán/Yu_1114 -0.19 Yucatán/Yu_1115 -0.04 Yucatán/Yu_1116 0.02 Yucatán/Yu_1117 0.05 Yucatán/Yu_1118 0.03 Yucatán/Yu_1119 0.10 Yucatán/Yu_1121 -0.06 Yucatán/Yu_1122 0.20 Yucatán/Yu_1123 -0.09 Yucatán/Yu_1124 -0.05 Yucatán/Yu_1125 0.20 Intervalo de confianza (95%) para sigma lower est. upper sigma 1.59 2.32 3.38

Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas

heterogéneas para Población y Familia dentro de Población. Observamos que las

varianzas de las poblaciones son bien diferentes: La población La Paz tiene la mayor

varianza estimada en (15.94*2.32)2 = 1367.57 mientras que la de menor varianza es

(2.32*1)2 = 5.38. Al comparar los modelos con varianzas heterogéneas y homogéneas

mediante una prueba de cociente de verosimilitud se corrobora que el modelo con

varianzas heterogéneas es el mejor (p<0.0001) como se muestra en la siguiente salida.

Comparación de modelos Call Model df AIC BIC logLik Test L.Ratio p-value Modelo000_Largo_REML 1 1 4 2016.47 2029.91 -1004.23 Modelo001_Largo_REML 2 2 10 1872.14 1905.75 -926.07 1 vs 2 156.33 <0.0001

Page 42: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

38

Los residuos obtenidos para el Modelo 1 con varianzas distintas en cada población no

muestran problemas de heteroscedasticidad y presentan una mejora en los supuestos

distribucionales respecto al Modelo 1 con varianzas homogéneas (Figura 23).

10 20 30 40 50 60 70

-2-1

01

23

fitted(modeloLargocm_8_REML,level=2)

Re

s.co

nd

.est

an

d.P

ea

rso

n

-3 -2 -1 0 1 2 3

-2-1

01

23

Cuantiles teóricos

Cu

an

tile

s m

ue

stra

les

Figura 23: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas residuales heterogéneas para poblaciones y los datos del archivo Compvar.IDB2.

Modelo 2: Para este modelo se debe declarar Población en la solapa de Efectos fijos.

Observar que en esta solapa se ha seleccionado además Coeficientes de los efectos fijos

(Figura 24). En la solapa de Efectos aleatorios se ha declarado familias como aleatorio,

se ha deseleccionado la opción por defecto de familia como efecto sobre la Constante

(intercepto), y se ha seleccionado familia como afectando los parámetros del efecto

población. La matriz de covarianzas de los efectos aleatorios asignados a poblaciones se

suponen independientes (pdIdent). Se han seleccionado además las opciones Matriz de

efectos aleatorios, Intervalo de confianza para los parámetros de la parte aleatoria e

Intervalo de confianza para sigma (Figura 25). En la solapa Comparaciones se

seleccionó la opción DGC para Población (Figura 26).

Page 43: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

39

Figura 24: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.

Figura 25: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.

Page 44: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

40

Figura 26: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.

A continuación de presenta la salida correspondiente a estas especificaciones:

Especificación del modelo en R modelo001_Largo_REML<-lme(Largo~1+Poblacion ,random=list(Familia=pdIdent(~Poblacion-1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 214 1967.65 1997.64 -974.82 21.54 0.51 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 601.79 <0.0001 Poblacion 6 108 27.23 <0.0001

Page 45: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

41

Efectos fijos Value Std.Error DF t-value p-value (Intercept) 8.23 5.75 108 1.43 0.1551 PoblacionEscarcega 56.89 8.03 108 7.08 <0.0001 PoblacionEsclavos 57.72 7.46 108 7.74 <0.0001 PoblacionLa Paz 62.24 8.13 108 7.66 <0.0001 PoblacionPacífico Sur 4.65 7.53 108 0.62 0.5382 PoblacionXpujil 65.45 7.72 108 8.48 <0.0001 PoblacionYucatán 44.44 8.40 108 5.29 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Poblacion - 1|Familia Desvíos estándares y correlaciones Charagre Escarcega Esclavos La Paz Pacífico Sur XpujilYucatán Charagre 14.79 0.00 0.00 0.00 0.00 0.00 0.00 Escarcega 0.00 14.79 0.00 0.00 0.00 0.00 0.00 Esclavos 0.00 0.00 14.79 0.00 0.00 0.00 0.00 La Paz 0.00 0.00 0.00 14.79 0.00 0.00 0.00 Pacífico Sur 0.00 0.00 0.00 0.00 14.79 0.00 0.00 Xpujil 0.00 0.00 0.00 0.00 0.00 14.79 0.00 Yucatán 0.00 0.00 0.00 0.00 0.00 0.00 14.79 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~Poblacion - 1|Familia LI(95%) est. LS(95%) sd( - 1) 10.71 14.79 20.42 Coeficientes (BLUP) de los efectos aleatorios (~Poblacion - 1|Familia) Charagre Escarcega Esclavos La Paz Pacífico Sur Xpujil Yucatán Ch_71 -1.08 0.00 0.00 0.00 0.00 0.00 0.00 Ch_710 0.62 0.00 0.00 0.00 0.00 0.00 0.00 Ch_711 1.34 0.00 0.00 0.00 0.00 0.00 0.00 Ch_712 1.47 0.00 0.00 0.00 0.00 0.00 0.00 Ch_713 -0.96 0.00 0.00 0.00 0.00 0.00 0.00 Ch_714 -1.08 0.00 0.00 0.00 0.00 0.00 0.00 Ch_715 -0.71 0.00 0.00 0.00 0.00 0.00 0.00 Ch_72 0.73 0.00 0.00 0.00 0.00 0.00 0.00 Ch_73 -0.84 0.00 0.00 0.00 0.00 0.00 0.00 Ch_74 -0.35 0.00 0.00 0.00 0.00 0.00 0.00 Ch_75 -0.60 0.00 0.00 0.00 0.00 0.00 0.00 Ch_76 -0.07 0.00 0.00 0.00 0.00 0.00 0.00 Ch_77 -0.48 0.00 0.00 0.00 0.00 0.00 0.00 Ch_78 0.50 0.00 0.00 0.00 0.00 0.00 0.00 Ch_79 1.53 0.00 0.00 0.00 0.00 0.00 0.00 Ec_31 0.00 0.00 -6.04 0.00 0.00 0.00 0.00 Ec_310 0.00 0.00 5.36 0.00 0.00 0.00 0.00 Ec_311 0.00 0.00 -5.56 0.00 0.00 0.00 0.00 Ec_312 0.00 0.00 -2.65 0.00 0.00 0.00 0.00 Ec_313 0.00 0.00 -16.00 0.00 0.00 0.00 0.00 Ec_314 0.00 0.00 20.66 0.00 0.00 0.00 0.00 Ec_315 0.00 0.00 -25.46 0.00 0.00 0.00 0.00 Ec_316 0.00 0.00 10.95 0.00 0.00 0.00 0.00 Ec_317 0.00 0.00 2.69 0.00 0.00 0.00 0.00 Ec_318 0.00 0.00 -5.80 0.00 0.00 0.00 0.00 Ec_319 0.00 0.00 2.94 0.00 0.00 0.00 0.00 Ec_32 0.00 0.00 -5.56 0.00 0.00 0.00 0.00 Ec_320 0.00 0.00 12.89 0.00 0.00 0.00 0.00 Ec_33 0.00 0.00 -0.46 0.00 0.00 0.00 0.00

Page 46: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

42

Ec_34 0.00 0.00 -7.99 0.00 0.00 0.00 0.00 Ec_35 0.00 0.00 10.95 0.00 0.00 0.00 0.00 Ec_36 0.00 0.00 -12.84 0.00 0.00 0.00 0.00 Ec_37 0.00 0.00 12.89 0.00 0.00 0.00 0.00 Ec_38 0.00 0.00 5.36 0.00 0.00 0.00 0.00 Ec_39 0.00 0.00 3.67 0.00 0.00 0.00 0.00 Es_1126 0.00 -0.06 0.00 0.00 0.00 0.00 0.00 Es_1127 0.00 16.20 0.00 0.00 0.00 0.00 0.00 Es_1128 0.00 16.63 0.00 0.00 0.00 0.00 0.00 Es_1129 0.00 6.49 0.00 0.00 0.00 0.00 0.00 Es_1130 0.00 -0.04 0.00 0.00 0.00 0.00 0.00 Es_1131 0.00 -7.09 0.00 0.00 0.00 0.00 0.00 Es_1132 0.00 19.12 0.00 0.00 0.00 0.00 0.00 Es_1133 0.00 1.15 0.00 0.00 0.00 0.00 0.00 Es_1134 0.00 -10.25 0.00 0.00 0.00 0.00 0.00 Es_1135 0.00 -10.94 0.00 0.00 0.00 0.00 0.00 Es_1136 0.00 -7.58 0.00 0.00 0.00 0.00 0.00 Es_1137 0.00 -16.32 0.00 0.00 0.00 0.00 0.00 Es_1138 0.00 14.26 0.00 0.00 0.00 0.00 0.00 Es_1139 0.00 -10.30 0.00 0.00 0.00 0.00 0.00 Es_1142 0.00 7.71 0.00 0.00 0.00 0.00 0.00 Es_1148 0.00 -18.99 0.00 0.00 0.00 0.00 0.00 LP_41 0.00 0.00 0.00 -18.43 0.00 0.00 0.00 LP_410 0.00 0.00 0.00 18.95 0.00 0.00 0.00 LP_411 0.00 0.00 0.00 14.82 0.00 0.00 0.00 LP_412 0.00 0.00 0.00 20.89 0.00 0.00 0.00 LP_413 0.00 0.00 0.00 -12.12 0.00 0.00 0.00 LP_414 0.00 0.00 0.00 -2.41 0.00 0.00 0.00 LP_415 0.00 0.00 0.00 -18.67 0.00 0.00 0.00 LP_42 0.00 0.00 0.00 1.23 0.00 0.00 0.00 LP_43 0.00 0.00 0.00 -1.93 0.00 0.00 0.00 LP_44 0.00 0.00 0.00 -1.68 0.00 0.00 0.00 LP_45 0.00 0.00 0.00 1.96 0.00 0.00 0.00 LP_46 0.00 0.00 0.00 -9.69 0.00 0.00 0.00 LP_48 0.00 0.00 0.00 -2.39 0.00 0.00 0.00 LP_49 0.00 0.00 0.00 9.48 0.00 0.00 0.00 PS_6204 0.00 0.00 0.00 0.00 -2.13 0.00 0.00 PS_6206 0.00 0.00 0.00 0.00 -2.73 0.00 0.00 PS_6207 0.00 0.00 0.00 0.00 2.48 0.00 0.00 PS_6208 0.00 0.00 0.00 0.00 -1.52 0.00 0.00 PS_6209 0.00 0.00 0.00 0.00 -0.67 0.00 0.00 PS_6210 0.00 0.00 0.00 0.00 1.51 0.00 0.00 PS_6211 0.00 0.00 0.00 0.00 -1.03 0.00 0.00 PS_6212 0.00 0.00 0.00 0.00 -2.01 0.00 0.00 PS_6213 0.00 0.00 0.00 0.00 0.18 0.00 0.00 PS_6214 0.00 0.00 0.00 0.00 -2.61 0.00 0.00 PS_6215 0.00 0.00 0.00 0.00 -0.31 0.00 0.00 PS_6216 0.00 0.00 0.00 0.00 8.55 0.00 0.00 PS_6217 0.00 0.00 0.00 0.00 -0.55 0.00 0.00 PS_6218 0.00 0.00 0.00 0.00 4.18 0.00 0.00 PS_6219 0.00 0.00 0.00 0.00 -1.64 0.00 0.00 PS_6220 0.00 0.00 0.00 0.00 -2.37 0.00 0.00 PS_6221 0.00 0.00 0.00 0.00 -0.55 0.00 0.00 PS_6222 0.00 0.00 0.00 0.00 -2.25 0.00 0.00 PS_660 0.00 0.00 0.00 0.00 3.46 0.00 0.00 Xp_11 0.00 0.00 0.00 0.00 0.00 -14.96 0.00 Xp_110 0.00 0.00 0.00 0.00 0.00 2.35 0.00 Xp_112 0.00 0.00 0.00 0.00 0.00 -0.09 0.00 Xp_113 0.00 0.00 0.00 0.00 0.00 -7.12 0.00 Xp_114 0.00 0.00 0.00 0.00 0.00 1.61 0.00 Xp_115 0.00 0.00 0.00 0.00 0.00 -12.46 0.00 Xp_116 0.00 0.00 0.00 0.00 0.00 15.93 0.00 Xp_117 0.00 0.00 0.00 0.00 0.00 10.11 0.00 Xp_118 0.00 0.00 0.00 0.00 0.00 6.95 0.00 Xp_119 0.00 0.00 0.00 0.00 0.00 16.91 0.00 Xp_12 0.00 0.00 0.00 0.00 0.00 -2.14 0.00 Xp_120 0.00 0.00 0.00 0.00 0.00 18.36 0.00 Xp_122 0.00 0.00 0.00 0.00 0.00 -20.72 0.00 Xp_123 0.00 0.00 0.00 0.00 0.00 -27.03 0.00 Xp_15 0.00 0.00 0.00 0.00 0.00 1.86 0.00 Xp_16 0.00 0.00 0.00 0.00 0.00 2.99 0.00 Xp_17 0.00 0.00 0.00 0.00 0.00 3.95 0.00 Xp_18 0.00 0.00 0.00 0.00 0.00 -4.94 0.00 Xp_19 0.00 0.00 0.00 0.00 0.00 8.44 0.00 Yu_1111 0.00 0.00 0.00 0.00 0.00 0.00 -14.89 Yu_1114 0.00 0.00 0.00 0.00 0.00 0.00 -16.59 Yu_1115 0.00 0.00 0.00 0.00 0.00 0.00 -3.24

Page 47: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

43

Yu_1116 0.00 0.00 0.00 0.00 0.00 0.00 1.86 Yu_1117 0.00 0.00 0.00 0.00 0.00 0.00 4.53 Yu_1118 0.00 0.00 0.00 0.00 0.00 0.00 2.83 Yu_1119 0.00 0.00 0.00 0.00 0.00 0.00 8.66 Yu_1121 0.00 0.00 0.00 0.00 0.00 0.00 -5.18 Yu_1122 0.00 0.00 0.00 0.00 0.00 0.00 17.15 Yu_1123 0.00 0.00 0.00 0.00 0.00 0.00 -7.85 Yu_1124 0.00 0.00 0.00 0.00 0.00 0.00 -4.45 Yu_1125 0.00 0.00 0.00 0.00 0.00 0.00 17.15 Intervalo de confianza (95%) para sigma lower est. upper sigma 18.77 21.54 24.71 Medias ajustadas y errores estándares para Poblacion DGC (alfa=0.05) Poblacion Medias E.E. Xpujil 73.68 5.16 A La Paz 70.47 5.74 A Esclavos 65.95 4.75 A Escarcega 65.12 5.61 A Yucatán 52.67 6.13 A Pacífico Sur 12.88 4.87 B Charagre 8.23 5.75 B Letras distintas indican diferencias significativas(p<= 0.05)

A continuación se muestra como ejemplo el cálculo de los BLUP para las familias de la

población Charagre:

,71 71( )

,72 72( )

,73 73( )

,74 74( )

ˆˆ ˆˆ 8.2296 0 ( 1.0823) 7.1473

ˆˆ ˆˆ 8.2296 0 0.7277 8.9573

ˆˆ ˆˆ 8.2296 0 ( 0.8396) 7.3900

ˆˆ ˆˆ 8.2296 0 ( 0.354

cha cha cha

cha cha cha

cha cha cha

cha cha cha

Y

Y

Y

Y

2) 7.8754

Ahora realizaremos el análisis del ajuste del Modelo 2. En el submenú Análisis-

exploración de modelos estimados se pidieron los gráficos de diagnóstico (Figura 27).

Page 48: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

44

Figura 27: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo 2 con los datos del archivo Compvar.IDB2.

El gráfico de residuos condicionales estandarizados de Pearson vs. Valores ajustados

(Figura 28) muestra varianzas residual heterogéneas para la variable Largo.

Page 49: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

45

Charagre La Paz Xpujil

-2-1

01

2

Poblacion

Res

.con

d.es

tand

.Pea

rson

20 40 60 80

-2-1

01

2

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-3 -2 -1 0 1 2 3

-2-1

01

2

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s

Figura 28: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo Compvar.IDB2

Respecto a los supuestos distribucionales, es importante destacar que, existiendo

heteroscedasticidad, el QQ-plot no debe ser interpretado hasta tanto no se corrija este

problema. Para incorporar las varianzas heterogéneas del efecto Población, en la solapa

heterogeneidad se debe especificar el factor Población como se mostró en la Figura 22.

Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas

heterogéneas para Población. Observamos que las varianzas de las poblaciones son bien

diferentes: La población La Paz tiene la mayor varianza estimada en (15.94*2.32)2 =

1367.57, mientras que la de menor varianza es Charagre con (1*2.32)2 = 5.38.

Page 50: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

46

Modelos lineales generales y mixtos Especificación del modelo en R modelo002_Largo_REML<-lme(Largo~1+Poblacion ,random=list(Familia=pdIdent(~Poblacion-1)) ,weight=varComb(varIdent(form=~1|Poblacion)) ,method="REML" ,na.action=na.omit ,data=R.data01 ,keep.data=FALSE) Resultados para el modelo: modelo002_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 214 1823.20 1873.20 -896.60 2.32 0.51 0.51 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 509.60 <0.0001 Poblacion 6 108 86.55 <0.0001 Efectos fijos Value Std.Error DF t-value p-value (Intercept) 8.23 0.61 108 13.42 <0.0001 PoblacionEscarcega 57.32 5.90 108 9.72 <0.0001 PoblacionEsclavos 57.72 4.33 108 13.33 <0.0001 PoblacionLa Paz 62.33 7.16 108 8.70 <0.0001 PoblacionPacífico Sur 4.65 1.28 108 3.65 0.0004 PoblacionXpujil 65.43 5.54 108 11.81 <0.0001 PoblacionYucatán 44.44 6.00 108 7.41 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Poblacion - 1|Familia Desvíos estándares y correlaciones Charagre Escarcega Esclavos La Paz Pacífico Sur Xpujil Yucatán Charagre 1.56 0.00 0.00 0.00 0.00 0.00 0.00 Escarcega 0.00 1.56 0.00 0.00 0.00 0.00 0.00 Esclavos 0.00 0.00 1.56 0.00 0.00 0.00 0.00 La Paz 0.00 0.00 0.00 1.56 0.00 0.00 0.00 Pacífico Sur 0.00 0.00 0.00 0.00 1.56 0.00 0.00 Xpujil 0.00 0.00 0.00 0.00 0.00 1.56 0.00 Yucatán 0.00 0.00 0.00 0.00 0.00 0.00 1.56

Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~Poblacion - 1|Familia LI(95%) Est. LS(95%) sd( - 1) 0.45 1.56 5.38

Page 51: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

47

Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Poblacion Parámetros de la función de varianza Parámetro Estim Charagre 1.00 Esclavos 11.64 Escarcega 13.09 La Paz 15.94 Pacífico Sur 2.81 Xpujil 13.38 Yucatán 12.55

Para probar que este modelo menos parsimonioso es el de mejor ajuste se realizó una

prueba del cociente de verosimilitud cuya salida se presenta a continuación.

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 001 9 1967.65 1997.64 -974.82

002 15 1823.20 1873.20 -896.60 1 vs 2 156.44 <0.0001

El modelo con varianzas heterogéneas para las distintas poblaciones es mejor que el de

varianzas homogéneas (p<0.0001). Podemos observar que con la inclusión de varianzas

heterogéneas para las distintas poblaciones el ajuste ha mejorado respecto a los ajustes

anteriores (Figura 29). Tanto en los box-plot de los residuos condicionales

estudentizados de Pearson como en el diagrama de dispersión de residuos condicionales

estudentizados de Pearson versus predichos, ya no se evidencian problemas graves de

falta de homogeneidad de varianzas. En el gráfico QQ-plot se observa una mejora en el

supuesto distribucional.

Page 52: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

48

Charagre La Paz Xpujil

-2-1

01

23

Poblacion

Res

.con

d.es

tand

.Pea

rson

10 20 30 40 50 60 70

-2-1

01

23

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-3 -2 -1 0 1 2 3

-2-1

01

23

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s

Figura 29: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del archivo Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población.

Page 53: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

49

Aplicación de modelos mixtos para datos estratificados

Parcelas divididas

Supongamos un experimento bifactorial en el que no es posible asignar al azar las

combinaciones de ambos factores a las parcelas experimentales (PE). En algunos casos,

grupos de PE reciben aleatoriamente los distintos niveles de uno de los factores de

clasificación y dentro de estos grupos de parcelas, los niveles del segundo factor son

asignados al azar.

El experimento descripto anteriormente difiere de un experimento bifactorial

convencional en que, si bien los niveles de los factores son asignados aleatoriamente a

las PE, no son los tratamientos (i.e. las combinaciones de los niveles de los factores) los

que están siendo asignados de esta forma. Esta manera particular de asignar las parcelas a los distintos niveles de los factores

representa una restricción a la aleatorización, e induce estructuras de correlación que

deben ser tenidas en cuenta en el momento del análisis. Este diseño se conoce como

parcela dividida. El nombre surge de la idea de que PARCELAS principales reciben los niveles de un

factor (también llamado a veces factor principal) y que estas parcelas son DIVIDIDAS

en SUBPARCELAS que reciben los niveles del segundo factor de clasificación. Aunque en las parcelas divididas los niveles de un factor son asignados dentro de los

niveles de otro factor, este NO ES un diseño anidado. Se trata de un experimento

típicamente factorial donde los factores están cruzados. Es sólo la aleatorización la que

se ha realizado en forma secuencial. De acuerdo a la forma en que están arregladas las parcelas principales, el diseño puede

ser de:

Parcelas divididas en un arreglo en bloques

Parcelas divididas en un arreglo completamente aleatorizado

Parcelas divididas en otros diseños

Page 54: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

50

Parcelas divididas en un arreglo en bloques

El análisis clásico de un diseño en parcelas divididas con parcelas principales

distribuidas en bloques completos incluye los siguientes términos en el modelo:

Factor asociado a la parcela principal (FPP)

Bloque

Bloque*FPP (error de la parcela principal)

Factor asociado a la subparcela (FSP)

FPP*FSP

Error (error para la subparcela)

El punto clave para completar el análisis de este modelo es comprender que el error

experimental para el FPP es diferente que para los términos del modelo que incluyen al

FSP. El error experimental de las parcelas principales es mayor que el de las

subparcelas.

La varianza del error experimental de las parcelas principales en un diseño de parcelas

divididas con parcelas principales repetidas en bloque completamente aleatorizados, se

estima como el cuadrado medio (CM) de la interacción Bloque*FPP (se asume que no

hay interacción Bloque*FPP y en consecuencia este CM estima el error entre parcelas

principales tratadas de la misma forma). El CM de esta “interacción” es el que se usa

como referencia para calcular el estadístico F de la prueba de hipótesis para el factor

principal. El resto de las pruebas el CM residual es el apropiado para construir el

estadístico F.

El análisis de este diseño mediante un modelo lineal mixto se basa en la identificación

de dos niveles de agrupamientos de las observaciones. El primer nivel esta dado por los

bloques y el segundo nivel por las parcelas principales dentro de los bloques. Cada uno

de estos niveles de agrupamiento genera una correlación, conocida como correlación

intraclase, entre las observaciones que contiene.

El modelo lineal mixto para este diseño es el siguiente:

; 1,.., ; 1,..., ; 1,...,ijk i j ij k ik ijky b p i T j G k B (4)

Page 55: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

51

donde ijky representa la respuesta observada en el k-ésimo bloque, i-ésimo nivel del

factor principal y j-ésimo nivel de factor asociado a las subparcelas. representa la

media general de la respuesta, i representa el efecto del i-ésimo nivel del factor

asociado a las parcelas principales, j representa el efecto del j-ésimo nivel del factor

asociado a las subparcelas y ij representa el efecto de la interacción del ij-ésimo

tratamiento. Por otra parte kb , ikp y ijk corresponden a efectos aleatorios de los

bloques, de las parcelas dentro de los bloques y de los errores experimentales. Las

suposiciones sobre estos componentes aleatorios es que 2~ 0,k bb N , 2~ 0,ik pp N ,

2~ 0,ijk N y que estos tres componentes aleatorios son independientes. A

continuación ejemplificaremos el análisis de un diseño en parcelas divididas en bloques

mediante la aplicación de un modelo lineal mixto.

En este ejemplo (Di Rienzo 2007) se evalúan 4 variedades de trigo: BUCK-Charrua

(BC), Las Rosas-INTA (LI), Pigué (Pe) y Pro-INTA Puntal (PP) bajo riego y secano

con el diseño a campo presentado en la Figura 30.

Figura 30: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2.

BC Pe PP LI Pe BC LI PP

Secano Riego

Page 56: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

52

Los datos de este ejemplo se encuentran en el archivo Trigo.IDB2. El encabezamiento

de la tabla de datos es la siguiente (Figura 31).

Figura 31: Encabezamiento de la tabla de datos del archivo Trigo.IDB2.

El factor en la parcela principal es Agua, el factor asociado a las subparcelas es

Variedad y la variable de respuesta es el Rendimiento. Los bloques están claramente

identificados, pero las parcelas principales no aparecen explícitamente. Esto es así

porque en un diseño en parcelas divididas, las parcelas principales dentro de un bloque

están confundidas con el factor principal. De esta forma las observaciones bajo “Riego”

en el bloque 1, representan las observaciones de una de las parcelas principales de ese

bloque.

Para analizar este ejemplo invocaremos la estimación de un modelo lineal mixto. Esta

invocación nos presentará, como es usual, la ventana de selección de variables. Su

imagen, con la selección apropiada de variables de respuesta y factores se muestra en la

Figura 32.

Figura 32: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Trigo.IDB2.

Page 57: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

53

Aceptando esta especificación, se mostrará el diálogo que permite especificar el

modelo. La solapa de la parte fija, ya especificada, se muestra en la Figura 33. En ella

aparecen los efectos principales Agua, Variedad y la interacción Agua*Variedad.

Figura 33: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2.

Para la especificación de la parte aleatoria, en la solapa Efectos aleatorios se debe

incorporar primero al factor Bloque y después al factor Agua. Esta es la forma de indicar

que Agua está dentro de Bloque. La especificación de la parte aleatoria queda como se

muestra en la Figura 34.

Page 58: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

54

Figura 34: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y agua como criterios de estratificación.

La salida correspondiente a esta estimación es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Rendimiento_REML<-lme(Rendimiento~1+Agua+Variedad+Agua:Variedad ,random=list(Bloque=pdIdent(~1) ,Agua=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 24 206.59 215.09 -92.30 51.65 0.84 0.89 0.91 AIC y BIC menores implica mejor

Page 59: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

55

Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 12 363.93 <0.0001 Agua 1 2 55.24 0.0176 Variedad 3 12 6.38 0.0078 Agua:Variedad 3 12 2.36 0.1223 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.55 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Agua dentro de Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.47

Las pruebas de hipótesis secuenciales son las correctas para este tipo de especificación

del modelo. Esto es debido a que primero se aleatoriza el factor en la PP, luego se

aleatoriza el factor en las SP y por último se especifica la interacción.

Antes de continuar con nuestro análisis, haremos algunas validaciones simples de las

suposiciones de estos modelos, revisando residuales estandarizados vs. predichos y

otros criterios de clasificación, así como el QQ-plot normal de residuos estandarizados.

Estos residuos son condicionales a los efectos aleatorios (es decir, aproximan los

errores). Para ello invocaremos el submenú Análisis-exploración de modelos estimados.

En el diálogo, seleccionaremos la solapa Diagnóstico y dentro de ella la subsolapa

Residuos vs. (Figura 35).

Page 60: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

56

Figura 35: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada para los datos del archivo Trigo.IDB2.

Si se seleccionan los ítems dentro de la lista disponible, como se muestra en la Figura

35, se obtendrá el gráfico siguiente (Figura 36). Este aparece en una nueva ventana que

genera R y su contenido puede copiarse oprimiendo el botón derecho del ratón, sobre la

imagen. En el menú que se despliega se podrá optar por “Copy as metafile” o “Copy as

bitmap”.

Page 61: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

57

Riego Secano

-1.0

0.0

0.5

1.0

Agua

Res

.con

d.es

tand

.Pea

rson

BUCK-Charrua Pigue

-1.0

0.0

0.5

1.0

Variedad

Res

.con

d.es

tand

.Pea

rson

300 400 500 600

-1.0

0.0

0.5

1.0

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-2 -1 0 1 2

-1.0

0.0

0.5

1.0

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s

Figura 36: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2.

Un examen rápido de la figura sugiere una posible heterogeneidad de varianzas entre

variedades. Para poder probar si es necesario incluir la estimación de varianzas

residuales diferentes para cada variedad hay que ajustar un modelo heteroscedástico y

compararlo con el homoscedástico, utilizando algún criterio como el AIC o BIC (o una

prueba del cociente de verosimilitud, ya que el modelo homoscedástico es un caso

particular del heteroscedástico).

Para ajustar el modelo heteroscedástico invocamos nuevamente al módulo de

estimación de los modelos mixtos y en la solapa Heteroscedasticidad seleccionamos el

modelo varIdent y una vez seleccionado hacemos doble clic sobre Variedad (en la lista

a la derecha de la ventana) para especificar a esta variable como criterio de

Page 62: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

58

agrupamiento (Figura 37). Luego accionamos el botón Agregar para hacer efectiva la

incorporación de esta especificación del modelo. Si por algún motivo la especificación

ingresada no es deseada, haciendo doble clic sobre la misma, ésta se borra.

Figura 37: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con selección de función varIdent con variedad como criterio de agrupamiento.

Las medidas de ajuste del modelo especificado son las siguientes:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 24 209.47 220.28 -90.73 24.49 0.84 0.89 0.90 AIC y BIC menores implica mejor

Page 63: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

59

Comparadas con las del modelo homoscedástico, no se observa una mejoría, por lo

contrario tanto AIC como BIC aumentaron. Por este motivo se descarta el modelo

heteroscedástico.

Luego volviendo al modelo homoscedástico, realizaremos comparaciones múltiples del

tipo LSD de Fisher para evaluar diferencias entre variedades. Para ello en la solapa

Comparaciones subsolapa Medias, tildaremos la opción Variedad como se muestra la

Figura 38.

Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y selección de la subsolapa Medias.

Al final de la salida del programa se encontrará la comparación de medias. Se observa

que solo BUCK-Charrua tuvo los rendimientos más bajos y esto ocurrió

independientemente de si tenía riego o no. En tanto las otras variedades tuvieron

rendimientos estadísticamente indistinguibles.

Page 64: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

60

Medias ajustadas y errores estándares para Variedad LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Variedad Medias E.E. Pro-INTA Puntal 469.50 28.48 A Pigue 430.98 28.48 A LasRosas-INTA 423.98 28.48 A BUCK-Charrua 342.73 28.48 B Letras distintas indican diferencias significativas(p<= 0.05)

Parcelas divididas en un arreglo en diseño completamente aleatorizado

A continuación ejemplificamos mediante un

experimento cuyo objetivo fue evaluar el efecto de un

coadyuvante sobre la cobertura de gotas y uniformidad

de aplicación en distintas ubicaciones de las hojas dentro

del canopeo de un cultivo de soja (Di Rienzo 2007). Para

ello se seleccionaron 16 sitios en cada uno de los cuales

se dispusieron 4 tarjetas hidro-sensibles, ubicadas a dos

alturas del canopeo (inferior, superior) y apuntando, sus

caras sensibles, en dos direcciones: hacia arriba y hacia

abajo. Las tarjetas hidrosensibles muestran una mancha

en el lugar donde cae una gota de agua. La superficie

manchada en estas tarjetas es una medida de cuanto

penetra y se dispersa el agua en una zona dada del canopeo. En 8 de los 16 sitios se

agregó al agua de pulverización un coadyuvante (para disminuir la tensión superficial

del agua y mejorar la dispersión de las gotas) y en los 8 restantes no. Por lo tanto en

cada sitio de pulverización se obtienen 4 lecturas correspondientes a las combinaciones

de las alturas (inferior y superior) y la ubicación de la cara sensible de la tarjeta (abajo y

arriba). Luego en cada sitio hay una repetición completa de un experimento con 4

tratamientos SuAr, SuAb, InAr y InAb, y que se combinan con la utilización o no del

coadyuvante en la solución de rociado.

El experimento resultante es un trifactorial, con un factor principal (coadyuvante)

asociado a parcelas principales (sitios donde se realiza el rociado) y dos factores (altura

y ubicación de cara sensible de la tarjeta) asociados a las subparcelas (tarjetas dentro de

Page 65: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

61

sitio). El archivo conteniendo los datos se llama Cobertura de gotas.IDB2 y el

encabezamiento de la tabla de datos se presenta en la Figura 39.

Figura 39: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2.

En la tabla de datos hay una columna que identifica a la parcela y va numerada de 1 a

16. Este va a ser el único efecto aleatorio de nuestro modelo.

El modelo lineal para las observaciones de este experimento es el siguiente:

;

1,..,2; 1,...,2; 1,...,2; 1,...,16

ijkl i j k ij ik jk ijk l ijkly b

i j k l

(5)

donde ijkly representa la respuesta observada en i-ésimo nivel del factor coadyuvante y

j-ésimo nivel de factor altura, k-ésimo nivel del factor cara en la l-ésima parcela,

representa la media general de la respuesta, i representa el efecto del i-ésimo nivel del

factor asociado a las parcelas principales (coadyuvante), j representa el efecto del j-

ésimo nivel del factor altura, k el k-ésimo nivel del factor cara, ambos asociados a las

subparcelas y ij , ik , jk y ijk las interacciones de segundo y tercer orden

correspondientes de los factores coadyuvante, altura y cara. Por otra parte lb y ijkl

representan los efectos aleatorios de las parcelas y de los errores experimentales

respectivamente. Las suposiciones sobre estos componentes aleatorios son que

2~ 0,l bb N , que 2~ 0,ijkl N , y que estas dos componentes aleatorias son

independientes.

A continuación presentamos la forma en que se especifica el modelo anterior en

InfoStat, su salida, interpretación y algunas acciones complementarias de validación del

modelo. Para ello invocaremos el Menú: Modelos lineales generales y

Page 66: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

62

mixtos>>Estimación. El diálogo de selección de variables para este caso se presenta en

la Figura 40.

Figura 40: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Cobertura de gotas.IDB2.

La especificación de la parte fija del modelo para este ejemplo contiene los tres factores

y sus interacciones dobles y triples (Figura 41).

Figura 41: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2.

Page 67: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

63

El efecto aleatorio que consideramos en este ejemplo es el de Parcela (Figura 42).

Figura 42: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2 con Parcela como criterio de estratificación.

Luego de aceptar las especificaciones anteriores obtendremos la siguiente salida:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Cobertura_REML<-lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coad:Altura:Cara ,random=list(Parcela=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Cobertura_REML Variable dependiente:Cobertura Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 64 670.38 690.63 -325.19 65.17 0.76 0.82 AIC y BIC menores implica mejor

Page 68: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

64

Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 42 233.37 <0.0001 Coad 1 14 1.89 0.1909 Altura 1 42 72.86 <0.0001 Cara 1 42 95.32 <0.0001 Coad:Altura 1 42 1.58 0.2152 Coad:Cara 1 42 0.01 0.9271 Altura:Cara 1 42 34.77 <0.0001 Coad:Altura:Cara 1 42 0.21 0.6476 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Parcela Desvíos estándares relativos al residual y correlaciones (Intercept) (Intercept) 0.40

Una revisión de los residuos estandarizados de este modelo mediante las herramientas

de diagnóstico en el Menú: Modelos lineales generales y mixtos>>Análisis-exploración

de modelos estimados muestra una posible heterogeneidad de varianzas cuando se

comparan las observaciones obtenidas cuando la cara sensible de la tarjeta hidrosensible

se presenta hacia arriba (Figura 43).

Ab Ar

-3-2

-10

12

3

Cara

Re

s.co

nd

.est

an

d.P

ea

rso

n

Figura 43: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara.

Page 69: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

65

Para ello invocaremos nuevamente el menú de estimación del modelo. Todas las

especificaciones anteriores se han preservado por lo que sólo tenemos que

concentrarnos en la especificación del modelo de la varianza. Para ello utilizaremos la

solapa heteroscedasticidad como se muestra en la Figura 44.

Figura 44: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2 con Cara como criterio de agrupamiento.

La salida resultante es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_Cobertura_REML<-lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coad:Altura:Cara ,random=list(Parcela=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Cara)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE)

Page 70: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

66

Resultados para el modelo: modelo001_Cobertura_REML Variable dependiente:Cobertura Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 64 636.54 658.82 -307.27 21.26 0.76 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 42 176.66 <0.0001 Coad 1 14 4.19 0.0599 Altura 1 42 53.72 <0.0001 Cara 1 42 98.43 <0.0001 Coad:Altura 1 42 13.83 0.0006 Coad:Cara 1 42 0.01 0.9259 Altura:Cara 1 42 35.90 <0.0001 Coad:Altura:Cara 1 42 0.22 0.6423 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Parcela Desvíos estándares relativos al residual y correlaciones DS(Const) DS(Const) 1.06 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Cara Parámetros del modelo Parámetro Estim Ab 1.00 Ar 4.15

El modelo para estos datos sería ijk i j k ijky b , donde i j representa el efecto fijo

de i-ésimo tratamiento en la j-ésima cara (cara puede ser Ab o Ar), kb es el efecto

aleatorio de la k-esima parcela experimental que se supone 20, bN y 2~ 0,ijk jN .

Luego la varianza de una observación tomada en una parcela seleccionada

aleatoriamente va a depender si se hace en la cara de abajo o arriba de la tarjeta. Así si

tomamos una observación de la cara de abajo la varianza va a ser (21.26*(1.06+1))2 y si

la tomamos en la cara de arriba: (21.26*(1.06+4.15))2.

Page 71: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

67

A continuación se presentan las medidas resumen del modelo homoscedástico y del

heteroscedástico.

Medidas de ajuste del modelo homoscedástico N AIC BIC logLik Sigma R2_0 R2_1 64 670.38 690.63 -325.19 65.17 0.76 0.82 AIC y BIC menores implica mejor Medidas de ajuste del modelo heteroscedástico N AIC BIC logLik Sigma R2_0 R2_1 64 636.54 658.82 -307.27 21.26 0.76 0.81 AIC y BIC menores implica mejor

Si comparamos los AIC y BIC veremos que el último modelo ajustado es mejor y por lo

tanto la interpretación de la pruebas de hipótesis debe basarse en este último.

Obsérvese que en la estructura de varianzas, la desviación estándar residual de las

observaciones en las tarjetas que apuntan hacia arriba es 4.15 veces mayor que la

desviación estándar residual de las observaciones en las tarjetas que apuntan hacia

abajo.

Por otra parte, observando los resultados de las pruebas de hipótesis resulta que la

interacción Coad:Altura:Cara no resultó significativa, por lo que se pueden observar

las interacciones dobles (Figura 45). Entre estas, Coad:Altura y Altura:Cara son

significativas. Estas interacciones se analizan utilizando la solapa Comparaciones de la

ventana Modelos lineales generales y mixtos y tildando las correspondientes

interacciones en la lista de términos del modelo que se presenta en esa ventana. Este

procedimiento creará una tabla con las medias de todas las combinaciones resultantes de

los niveles de los factores que intervienen en la interacción. El resultado, al final de la

salida, presenta las siguientes tablas.

Medidas ajustadas y errores estándares para Coad*Altura LSD Fisher (alfa=0,05) Procedimiento de corrección de p-valores: No Coad Altura Medias E.E. Si Su 253.94 17.89 A No Su 204.69 17.89 A Si In 94.38 17.89 B No In 86.13 17.89 B Letras distintas indican diferencias significativas(p<= 0.05)

Page 72: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

68

Medidas ajustadas y errores estándares para Altura*Cara LSD Fisher (alfa=0,05) Procedimiento de corrección de p-valores: No Altura Cara Medias E.E. Su Ar 356.88 22.74 A In Ar 121.75 22.74 B Su Ab 101.75 7.73 B In Ab 58.75 7.73 C Letras distintas indican diferencias significativas(p<= 0.05)

Sin coadyuvante Con coadyuvante

Superior Inferior

Altura

0

50

100

150

200

250

300

Co

be

rtu

ra

Sin coadyuvante Con coadyuvante Cara abajo Cara arriba

Superior Inferior

Altura

0

100

200

300

400

Co

be

rtu

ra

Cara abajo Cara arriba

Figura 45: Diagramas de puntos para estudiar la interacción entre Coad y Altura y entre Cara y Altura.

Parcelas subdivididas (split-split plot)

Este diseño utiliza el mismo principio que las parcelas divididas, excepto que lo

extiende un paso más. El principio puede extenderse arbitrariamente a niveles más

profundos de división. El modelo lineal para este diseño, suponiendo las parcelas

principales agrupadas en bloques completos aleatorizados, es el siguiente:

ijkl i j k ij ik jk ijk l il jil kjil ijkly b p sp ssp (6)

En la expresión anterior representa la media general, i el i-ésimo nivel del factor

asociado a las parcelas principales, j el j-ésimo nivel del factor asociado a las

subparcelas dentro de las parcelas principales, k el k-ésimo nivel del factor asociado a

las sub-subparcelas (dentro de las subparcelas) y ij , ik , jk y ijk las correspondientes

interacciones. Los términos aleatorios de éste modelo corresponden a los efectos de

Page 73: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

69

bloques, 2~ 0,l bb N , los efectos de parcelas, 2~ 0,il pp N , los efectos de

subparcelas, 2~ 0,jil spsp N , los efectos de sub-subparcelas, 2~ 0,kjil sppssp N y el

error experimental, 2~ 0,ijkl N . Todos ellos, como siempre, se suponen

independientes.

Consideremos ahora un ejemplo. Los datos están en el archivo Calidad del

almidón.IDB2 (Di Rienzo 2007). En este experimento se evalúa el índice de absorción

de agua (IAA) del almidón cocido y crudo obtenido de dos genotipos de Quínoa

cultivada bajo 4 niveles de fertilización nitrogenada. Las variedades son Faro y

UDEC10. Éstas se asignaron a grandes parcelas dispuestas en 3 bloques. Las parcelas

en las que fueron sembradas las variedades fueron divididas en 4 subparcelas a las que

se les asignaron 4 dosis de fertilización: 0, 75, 150 y 225 kg/ha. Las subparcelas fueron

nuevamente divididas en 2 para asignar el tratamiento de cocción o sin cocción (crudo).

El esquema para este diseño de experimento se presenta en la Figura 46.

Figura 46: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del almidón.IDB2.

Para el análisis de este diseño mediante un modelo mixto, además de la especificación

de la parte fija, como en un clásico experimento tri-factorial, sólo debemos especificar

la parte aleatoria para incluir el efecto aleatorio de los Bloques, de las Parcelas

Bloque 1

Bloque 2

Bloque 3

Sub-sub Parcela

Sub-Parcela Parcela principal

Page 74: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

70

Principales dentro de Bloques y de las Subparcela dentro de Parcelas. El

encabezamiento del archivo Calidad del Almidón.IDB2 se presenta en la Figura 47.

Figura 47: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2.

La ventana de selección de variables para este ejemplo tendrá que contener la

información que se presenta en la Figura 48.

Figura 48: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Calidad del Almidón.IDB2.

La especificación de la parte fija deberá contener los factores e interacciones

presentados en la Figura 49.

Page 75: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

71

Figura 49: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidón.IDB2.

La parte aleatoria deberá tener declarados a los bloques (Bloque), a las parcelas

principales dentro de Bloques (Genotipo) y a las subparcelas dentro de parcelas

principales (Nitrógeno) (Figura 50).

Page 76: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

72

Figura 50: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2.

La salida correspondiente es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_IAA_REML<-lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Coccion+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion ,random=list(Bloque=pdIdent(~1) ,Genotipo=pdIdent(~1) ,Nitrogeno=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_IAA_REML Variable dependiente:IAA

Page 77: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

73

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 16 1389.20 <0.0001 Genotipo 1 2 14.49 0.0626 Nitrogeno 3 12 0.78 0.5287 Coccion 1 16 32.90 <0.0001 Genotipo:Nitrogeno 3 12 0.88 0.4769 Genotipo:Coccion 1 16 37.67 <0.0001 Nitrogeno:Coccion 3 16 1.74 0.1998 Genotipo:Nitrogeno:Coccion.. 3 16 0.46 0.7108 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.3E-05 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Genotipo dentro de Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 5.0E-06 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Nitrogeno dentro de Genotipo dentro de Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.8E-05

Podríamos seguir realizando pruebas de diagnóstico pero asumiremos que el modelo es

correcto. La interpretación de las pruebas de hipótesis indica que sólo la interacción

Genotipo:Cocción es significativa. Las comparaciones múltiples para las medias de

tratamientos correspondientes a esta interacción se presentan a continuación. En estas

pruebas se observa que sólo el almidón cocido del genotipo UDEC10 presenta un IAA

significativamente mayor que el resto de combinaciones de Genotipo y Cocción.

Page 78: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

74

Medidas ajustadas y errores estándares para Genotipo*Coccion LSD Fisher (alfa=0,05) Genotipo Coccion Medias E.E. UDEC10 Cocido 4.64 0.18 A Faro Crudo 2.97 0.18 B Faro Cocido 2.90 0.18 B UDEC10 Crudo 2.56 0.18 B

Letras distintas indican diferencias significativas(p<= 0.05)

Una manera alternativa de formular el modelo anterior consiste en dejar los efectos fijos

como en la Figura 49 y especificar los efectos aleatorios como se muestra en la Figura

51. Los resultados son exactamente los mismos que antes, excepto por el cálculo de los

grados de libertad del denominador y por ende los valores de probabilidad. Esta es una

aproximación también válida aunque la versión anterior es acorde con el análisis

tradicional basado en efectos fijos. Además, las estimaciones de varianza están

presentadas en forma diferente.

Figura 51: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2 que contempla otra forma de especificar la parte aleatoria.

Page 79: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

75

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_IAA_REML<-lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Coccion+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion ,random=list(Bloque=pdIdent(~1) ,Bloque=pdIdent(~Genotipo-1) ,Bloque=pdIdent(~Genotipo:Nitrogeno-1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_IAA_REML Variable dependiente:IAA Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 30 1389.20 <0.0001 Genotipo 1 30 14.49 0.0006 Nitrogeno 3 30 0.78 0.5157 Coccion 1 30 32.90 <0.0001 Genotipo:Nitrogeno 3 30 0.88 0.4605 Genotipo:Coccion 1 30 37.67 <0.0001 Nitrogeno:Coccion 3 30 1.74 0.1807 Genotipo:Nitrogeno:Coccion.. 3 30 0.46 0.7089 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.3E-05 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Genotipo - 1|Bloque Desvíos estándares relativos al residual y correlaciones Faro UDEC10 Faro 5.0E-06 0.00 UDEC10 0.00 5.0E-06

Page 80: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

76

Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Genotipo:Nitrogeno - 1|Bloque Desvíos estándares relativos al residual y correlaciones Faro:0 UDEC10:0 Faro:75 UDEC10:75 Faro:150 UDEC10:150 Faro:225 UDEC10:225 Faro:0 1.8E-05 0 0 0 0 0 0 0 UDEC10:0 0 1.8E-05 0 0 0 0 0 0 Faro:75 0 0 1.8E-05 0 0 0 0 0 UDEC10:75 0 0 0 1.8E-05 0 0 0 0 Faro:150 0 0 0 0 1.8E-05 0 0 0 UDEC10:150 0 0 0 0 0 1.8E-05 0 0 Faro:225 0 0 0 0 0 0 1.8E-05 0 UDEC10:225 0 0 0 0 0 0 0 1.8E-05

Page 81: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

77

Aplicación de modelos mixtos para mediciones repetidas en el tiempo

Datos longitudinales

Para la modelación de datos longitudinales el aspecto más importante a considerar es la

estructura de la matriz de covarianza residual, que es posible modelar especificando la

matriz de correlación. En algunos casos también las varianzas pueden ser distintas para

algún criterio de agrupamiento y se debe modelar la heteroscedasticidad. Recordemos

que existe correlación residual entre observaciones que comparten el mismo valor del

criterio de estratificación, conocido también como sujeto, (por ejemplo, tomadas sobre

la misma persona, la misma parcela, el mismo animal, el mismo árbol, etc.). Así, la

matriz de covarianza residual para todas las observaciones será una matriz diagonal por

bloques, y en cada bloque se reflejará la estructura deseada, i.e. simetría compuesta,

autorregresiva de orden 1, etc.

Para especificar esto, InfoStat presenta dos solapas. En la solapa Correlación se

encuentran las opciones que permiten especificar la estructura de correlación de los

errores y en la solapa Heteroscedasticidad se pueden seleccionar distintos modelos de

varianza. Así, las distintas estructuras de la matriz de covarianza residual que se pueden

ajustar resultan de combinar las distintas estructuras de correlación con la posible

heteroscedasticidad en el tiempo. Si adicionalmente se desea especificar un efecto

aleatorio también es posible hacerlo usando la solapa correspondiente. En este caso se

debe tener mucha precaución de no combinar efectos aleatorios, estructuras de

correlación y de heteroscedasticidad tales que el modelo final no sea identificable. Esto

sucede cuando existe un conjunto infinito de valores de los parámetros para los cuales el

modelo es indistinguible, y por lo tanto las soluciones a las ecuaciones de verosimilitud

no son únicas.

Ejemplos de estas situaciones ocurren cuando se especifica una estructura de

correlación de simetría compuesta con un criterio de estratificación (por ejemplo, la

parcela) y un efecto aleatorio de ese mismo criterio de estratificación sobre la constante.

En este caso la estructura de covarianza de las observaciones será una matriz diagonal

por bloques, y cada bloque tendrá una estructura de simetría compuesta. Por lo tanto,

esta estructura tiene intrínsecamente dos parámetros. Pero de la manera que la hemos

especificado aparecen tres parámetros (varianza del efecto aleatorio, correlación

Page 82: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

78

intraclase de la estructura de correlación residual y varianza residual). Esta

sobreparametrización hace que existan infinitas soluciones, y por lo tanto los

estimadores no se pueden interpretar (y en muchos casos el algoritmo numérico no

converge). Otra situación común es la de una correlación sin estructura (corSymm) con

un criterio de estratificación dado (por ejemplo la parcela) y un efecto aleatorio de ese

mismo criterio de estratificación sobre la constante (intercept).

Análisis de un ensayo de establecimiento de forrajeras

A continuación se presenta un ejemplo de modelación de observaciones repetidas en el

tiempo. Los datos provienen de un ensayo de establecimiento de forrajeras para

comparar cinco métodos de labranza (labranza mínima, labranza mínima con herbicida,

labranza mínima con herbicida y arado de disco a los 45 días, labranza cero, y labranza

convencional) en la región central húmeda de Puerto Rico. La especie usada fue

Brachiaria decumbens cv. Basilik. El experimento estaba diseñado en tres bloques

completos aleatorizados, y se analizan aquí las medidas de cobertura (porcentaje de

cobertura estimado en cada parcela). Hay 5 medidas repetidas, tomadas con intervalos

de un mes entre agosto y diciembre de 2001 (Moser y Macchiavelli 2002). Los datos se

encuentran en Cobertura forrajes.IDB2 en la carpeta de datos de prueba de InfoStat.

Los perfiles promedio de cobertura observados en los cinco tiempos para cada uno de

los tratamientos se presentan en la Figura 52.

Trat1 Trat2 Trat3 Trat4 Trat5

1 2 3 4 5

Tiempo

0

10

20

30

40

50

Co

be

rtu

ra (

%)

Cobertura de Brachiaria decumbens

Trat1 Trat2 Trat3 Trat4 Trat5

Figura 52: Relación entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2.

Page 83: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

79

Como estrategia general para analizar estos datos primero se ajustarán modelos con

distintas estructuras de covarianza, combinando apropiadamente estructuras de

correlación residual, heteroscedasticidad residual y efectos aleatorios. Mediante criterios

de verosimilitud penalizada (AIC y BIC) se elegirá el modelo que mejor describa los

datos, y usando este modelo se realizarán inferencias acerca de las medias (comparar

tratamientos, estudiar el efecto del tiempo, analizar si los perfiles promedio varían en el

tiempo, si son paralelos, etc.).

Para el elegir el mejor modelo comenzaremos proponiendo un modelo sencillo con

pocos parámetros a estimar (i.e. parsimonioso), e iremos adicionando parámetros hasta

llegar al modelo sin estructura, que es el menos parsimonioso.

Se usarán las siguientes estructuras de covarianza para los datos (covarianza marginal):

1. Errores independientes y homoscedásticos.

2. Errores independientes y heteroscedásticos.

3. Correlación constante entre errores de la misma parcela y varianza residual constante en el tiempo.

4. Correlación constante entre errores de la misma parcela y varianza residual diferente en los distintos tiempos.

5. Estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual constante en el tiempo.

6. Estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual diferente en los distintos tiempos.

7. Estructura autorregresiva de orden 1 entre los errores de la misma parcela, varianza residual constante en el tiempo y efecto aleatorio de parcela.

8. Estructura autorregresiva de orden 1 entre los errores de la misma parcela, varianza residual diferente en los distintos tiempos y efecto aleatorio de parcela.

9. Sin estructura para las correlaciones entre errores provenientes de la misma parcela y varianzas residuales diferentes en el tiempo.

Para ajustar estos modelos en primer lugar se deben declarar las variables como se

indica en la Figura 53.

Page 84: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

80

Figura 53: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del ejemplo Cobertura forrajes.IDB2.

En todos los casos se usó el mismo modelo de medias, ya que la parte fija del modelo

referido no cambió (imprescindible si se desea comparar estructuras de covarianza

usando REML, y por ende los criterios de AIC y BIC) (Figura 54). A continuación se

detallará la forma de declarar cada uno de los modelos a evaluar seguido por una salida

de InfoStat con las medidas de ajuste correspondientes.

Page 85: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

81

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2.

Modelo 1: Errores independientes y homoscedásticos

En la solapa Correlación se debe declarar Errores independientes (Figura 55), que es la

opción por defecto, y en la solapa Heteroscedasticidad no se declara nada.

Page 86: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

82

Figura 55: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de Errores independientes (Modelo 1).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 465.05 517.45 -204.53 12.19 0.63 AIC y BIC menores implica mejor

Modelo 2: Errores independientes y heteroscedásticos

En la solapa Correlación se debe declarar Errores independientes (opción por defecto)

y en la solapa Heteroscedasticidad se declara varIdent y en criterio de agrupamiento se

declara Tiempo (Figura 56).

Page 87: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

83

Figura 56: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2 con selección de función varIdent con tiempo como criterio de agrupamiento

(Modelo 2).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 465.83 525.71 -200.91 6.75 0.61

AIC y BIC menores implica mejor

Modelo 3: Correlación constante entre datos de la misma parcela y varianza constante en el

tiempo.

En la solapa Correlación se eligió la opción Simetría Compuesta. Se debe declarar

también el Criterio de agrupamiento, en este caso la Parcela, para indicar que se está

modelando la correlación de datos provenientes de una misma parcela (Figura 57). En la

solapa Heteroscedasticidad se dejó la opción por defecto, es decir no se eligió ningún

criterio (para esto ir a la solapa Heteroscedasticidad y borrar la selección anterior

desactivando todas las opciones y borrando varIdent(form=~1) con un doble clic).

Page 88: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

84

Figura 57: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de simetría compuesta para datos

agrupados por parcela (Modelo 3).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 458.67 512.94 -200.34 12.59 0.63 AIC y BIC menores implica mejor

Modelo 4: Correlación constante entre datos de la misma parcela y varianza diferente en los

distintos tiempos.

En la solapa Correlación se eligió la opción Simetría compuesta y en la solapa

Heteroscedasticidad eligió la opción varIdent y en Criterios de agrupamiento se declara

Tiempo.

Page 89: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

85

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 456.66 518.41 -195.33 8.05 0.48 AIC y BIC menores implica mejor

Modelo 5: Estructura autorregresiva de orden 1 entre los errores de la misma parcela y

varianza residual constante en el tiempo.

En la solapa Correlación se eligió la opción Autorregresivo de orden 1 (Figura 58).

Debido a que este modelo tiene en cuenta el orden en que fueron tomadas las

observaciones, la variable que indica esto se debe declarar en la ventana

correspondiente (en este caso la variable Tiempo). En la solapa Heteroscedasticidad se

dejó la opción por defecto, es decir no se eligió ningún criterio (para esto ir a la solapa

Heteroscedasticidad y borrar la selección anterior desactivando todas las opciones y

borrando varIdent(form=~1) con un doble clic).

Figura 58: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de modelo Autorregresivo de orden 1 para datos agrupados por parcela y

orden de las observaciones indicado por la variable Tiempo (Modelo 5).

Page 90: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

86

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 449.36 503.62 -195.68 12.40 0.63 AIC y BIC menores implica mejor

Modelo 6: Estructura autorregresiva de orden 1 entre los errores de la misma parcela y

varianza residual diferente en los distintos tiempos.

En la solapa Correlación se eligió la opción Autorregresivo de orden 1. En la solapa

Heteroscedasticidad se eligió la opción varIdent y se especificó el criterio de

agrupamiento que en este caso es la variable tiempo.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 452.40 514.15 -193.20 8.78 0.63

AIC y BIC menores implica mejor

Modelo 7: Estructura autorregresiva de orden 1 entre los errores de la misma parcela,

varianza residual constante en el tiempo y efecto aleatorio de parcela.

En la solapa Correlación se eligió la opción Autorregresivo de orden 1 (igual que el

Modelo 5, Figura 58) y en la solapa Heteroscedasticidad se dejó la opción por defecto,

es decir no se eligió ningún criterio y se borraron las selecciones realizadas con

anterioridad. En la solapa Efectos aleatorios se declaró a Parcela en Criterios de

estratificación (Figura 59).

Page 91: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

87

Figura 59: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 con parcela como criterio de estratificación (Modelo 7).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 75 451.36 507.49 -195.68 12.40 0.63 0.63 AIC y BIC menores implica mejor

Modelo 8: Estructura autorregresiva de orden 1 entre los errores de la misma parcela,

varianza residual diferente en los distintos tiempos y efecto aleatorio de parcela.

Page 92: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

88

En la solapa Correlación se eligió la opción Autorregresivo “continuo” de orden 1

(Figura 60) para mostrar que en este caso es igual al Autorregresivo de orden 1. Si los

tiempos no fuesen equidistantes, la estructura corAR1 no es aplicable, y se debe usar su

análoga continua (corCAR1). Para este ejemplo ambas estructuras son equivalentes

debido a que los tiempos son equidistantes.

En la solapa Heteroscedasticidad se dejó la opción varIdent (como en la Figura 56). En

la solapa Efectos aleatorios se declaró a Parcela como Criterio de estratificación (como

en el Modelo 7, Figura 59).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 75 454.40 518.03 -193.20 8.78 0.63 0.63 AIC y BIC menores implica mejor

Figura 60: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de modelo Autorregresivo continuo de orden 1 para datos agrupados por

parcela y orden de las observaciones indicado por la variable Tiempo (Modelo 8).

Page 93: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

89

Modelo 9: Sin estructura para los datos provenientes de la misma parcela.

En la solapa Correlación se eligió la opción Sin estructura (Figura 61) y en la solapa

Heteroscedasticidad se dejó tildada la opción varIdent (como en Figura 56). En la

solapa Efectos aleatorios se eliminó Parcela en Criterios de estratificación.

Figura 61: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de modelo Sin estructura para datos agrupados por parcela y orden de las

observaciones indicado por la variable Tiempo (Modelo 9).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 425.03 503.62 -170.51 6.82 0.60 AIC y BIC menores implica mejor

Page 94: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

90

Selección de la estructura de covarianza

Si comparamos los valores de AIC (o los de BIC) para las estructuras que hemos

ajustado, se puede observar que el menor valor se obtiene con el Modelo 9 (AIC =

425.03, BIC = 503.62). Por lo tanto elegimos la covarianza sin estructura. Observemos

los parámetros estimados bajo este modelo:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 425.03 503.62 -170.51 6.82 0.60 AIC y BIC menores implica mejor

Estructura de correlación

Modelo de correlacion: General correlation

Formula: ~ as.integer(Tiempo) | Parcela

Matriz de correlación común

1 2 3 4

2 0.3230

3 0.7160 0.2760

4 0.0650 0.0990 0.4600

5 0.0450 0.1240 0.4580 0.9950

Estructura de varianzas

Modelo de varianzas: varIdent

Formula: ~ 1 | Tiempo

Parámetros del modelo

Parámetro Estim

1 1.0000

2 1.1819

3 1.9653

4 2.3775

5 2.2697

Las varianzas estimadas para cada uno de los 5 tiempos se calculan de la siguiente

manera:

Page 95: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

91

2 21

222

223

224

225

ˆ 6.8211 46.53

ˆ 1.1819 6.8211 64.99

ˆ 1.9653 6.8211 179.71

ˆ 2.3775 6.8211 263.00

ˆ 2.2697 6.8211 239.69

Las 10 correlaciones estimadas aparecen directamente como una matriz en Estructura

de Correlación.

Inferencia sobre las medias

Una vez elegida la estructura de covarianza de los datos (en este caso el modelo sin

estructura) podemos proceder a realizar inferencias acerca de las medias. Los perfiles

promedios observados para cada tratamiento se presentaron en la Figura 52.

En un experimento factorial como este, donde se tiene el factor tratamiento y el factor

tiempo, lo primero que se debe indagar es si existe interacción entre los tratamientos y

el tiempo. Para ello podemos realizar una prueba de Wald, que aparece directamente en

InfoStat como Trat:Tiempo en las pruebas secuenciales (recordemos que la interacción

es el último término que colocamos en el modelo). Otra opción es realizar una prueba

del cociente de verosimilitudes (LRT por sus siglas en inglés). Para esta última no

podemos usar REML debido a que estamos probando modelos con efectos fijos

diferentes, y por lo tanto los estimadores REML no son comparables. En su lugar se usa

el estimador máximo verosímil (ML).

Pruebas de hipótesis secuenciales

numDF F-value p-value

(Intercept) 1 127.93 <0.0001

Bloque 2 2.75 0.0739

Tratam 4 6.28 0.0004

Tiempo 4 16.77 <0.0001

Tratam:Tiempo 16 1.49 0.1417

Para realizar una prueba de cociente de verosimilitudes podemos ajustar (con ML) dos

modelos con la misma estructura de covarianza (en este ejemplo el modelo sin

Page 96: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

92

estructura) pero que difieren en su parte fija: uno contiene la interacción (modelo

completo) y el otro no la contiene (modelo reducido):

Modelo completo:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 535.33 632.67 -225.67 5.29 0.60

AIC y BIC menores implica mejor

Modelo reducido:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 75 527.01 587.27 -237.51 5.55 0.38 AIC y BIC menores implica mejor

Si bien la prueba LRT se puede obtener directamente desde el menú Análisis-

exploración de modelos estimados, solapa Modelos, a continuación se muestra otra

forma de calcularla. En primer lugar se obtiene el estadístico de la prueba LRT,

2 log lik 2log lik 2( 225.67) 2( 237.51) 23.68completo reducidoG . Este tiene 42-

26=16 grados de libertad, y arroja un valor p=0.0967, por lo que podemos decir que no

existe interacción con un nivel de significancia del 5%. Este valor de probabilidad se

obtiene a partir de una distribución chi-cuadrado con 16 grados de libertad, y puede ser

calculado con la herramienta Calculador de probabilidades y cuantiles del menú

Estadísticas de InfoStat (Figura 62).

Page 97: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

93

Figura 62: Ventana del Calculador de probabilidades y cuantiles de InfoStat.

Ambas pruebas (Wald y LRT) indican una interacción no significativa (aunque los

p-valores no son demasiado altos, p=0.1417 y p=0.0967 respectivamente), por lo que

podemos (con precaución) realizar pruebas de efectos de tratamiento y tiempo por

separado.

Contrastando tiempos sucesivos

Para comparar los tiempos sucesivos, es decir el tiempo 1 con el tiempo 2, el tiempo 2

con el tiempo 3 y así sucesivamente, se debe activar la solapa Comparaciones y dentro

de esta la subsolapa Contrastes y seleccionar el efecto Tiempo (Figura 63). El resto de

las ventanas debe quedar como en el Modelo 9, que fue elegido como el de mejor

estructura de correlación para explicar el comportamiento de estos datos en el tiempo.

Page 98: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

94

Figura 63: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de la subsolapa Contrastes.

Pruebas de hipótesis para contrastes

F gl(num) gl(den) p-valor

Cont.1 18.94 1 48 0.0001

Cont.2 2.70 1 48 0.1070

Cont.3 0.19 1 48 0.6640

Cont.4 0.34 1 48 0.5645

Total 16.77 4 48 <0.0001

Las salidas presentadas aquí corresponden a las estimaciones REML. Está claro a partir

de estos resultados que, en promedio para los cuatro tratamientos, se ve un cambio

significativo entre los tiempos 1 y 2, pero en tiempos posteriores la cobertura promedio

no cambia significativamente. Las mismas conclusiones se obtienen realizando una

comparación de medias de cada tiempo (LSD):

Page 99: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

95

Medias ajustadas y errores estándares para Tiempo LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Tiempo Medias E.E. 3 30.29 3.46 A 4 28.53 4.19 A 5 28.27 4.00 A 2 24.53 2.08 A 1 14.73 1.76 B Letras distintas indican diferencias significativas(p<= 0.05)

Comparación de tratamientos

Medias ajustadas y errores estándares para Tratam LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Tratam Medias E.E. 5 39.60 5.15 A 1 31.27 5.15 A B 4 24.96 5.15 A B C 3 17.33 5.15 B C 2 13.19 5.15 C Letras distintas indican diferencias significativas(p<= 0.05)

A partir de esta comparación de medias ajustadas se puede concluir que los tratamientos

5, 1 y 4 son los que proveen mayor cobertura y no se diferencias estadísticamente entre

sí.

Page 100: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

96

Análisis de un ensayo de drogas para asma

Una compañía farmacéutica ha examinado los efectos de dos drogas (A y B) sobre la

capacidad respiratoria de pacientes de asma (Littel et ál. 2002, 2006). Las dos drogas y

un placebo fueron administradas a un grupo de pacientes en forma aleatoria. Se contó

con 24 pacientes por cada uno de los tres tratamientos. A cada paciente se le midió la

capacidad respiratoria basal (Cap_Rep_Bas) inmediatamente antes de aplicarle el

tratamiento y la capacidad respiratoria cada hora durante las 8 horas siguientes

(Cap_Respirat). Los datos están en el archivo CapacidadRespiratoria.IDB2.

Usando nuevamente la estrategia definida en los ejemplos anteriores, primero se

ajustarán modelos con distintas estructuras de covarianza, combinando apropiadamente

estructuras de correlación residual, heteroscedasticidad residual y efectos aleatorios.

Mediante criterios de verosimilitud penalizada (AIC y BIC) y pruebas de cociente de

verosimilitud se elegirá el modelo que mejor describa los datos. Una vez seleccionado el

modelo de estructura de covarianza adecuado se realizarán inferencias acerca de las

medias (comparar medias de drogas, estudiar el efecto del tiempo, analizar si los

perfiles promedio varían en el tiempo, si son paralelos, etc.). Es importante destacar que

toda la inferencia sobre las medias estará basada en el modelo de estructura de

covarianza seleccionado.

Debido a que la variable que identifica al paciente (Paciente) en la base de datos toma

valores iguales dentro de cada droga, para identificar a los 72 pacientes de este estudio

se ha debido crear una nueva variable (paciente_droga) que identifica completamente al

paciente. Para hacer esto se ha usado el menú Datos, submenú Cruzar categorías para

formar una nueva variable (seleccionado Paciente y Droga en la ventana del selector de

variables). Este es un experimento bifactorial y se usa un modelo que contempla los

factores Droga, Hora y su interacción y la covariable Cap_Rep_Bas (todos de efectos

fijos). Para realizar el análisis de este modelo, se deben declarar las variables de la

siguiente forma (Figura 64).

Page 101: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

97

Figura 64: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2.

En primer lugar se evaluará un conjunto de modelos para determinar cuál es el que

mejor ajusta. Los modelos evaluados son:

1. Errores independientes y varianzas residuales homoscedásticas.

2. Simetría compuesta y varianzas residuales homoscedásticas.

3. Auto regresivo de orden 1 y varianzas residuales homoscedásticas.

4. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas.

5. Auto regresivo de orden 1 y varianzas residuales homoscedásticas y efecto aleatorio de paciente.

6. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas y efecto aleatorio de paciente.

7. Matriz de varianzas y covarianzas sin estructura y varianzas residuales heteroscedásticas.

La especificación de la parte fija del modelo es la misma para los 7 modelos evaluados

(Figura 65). Para obtener el ajuste del Modelo 1 solo se debe activar el botón Aceptar

con el modelo de efectos fijos presentado a continuación:

Page 102: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

98

Figura 65: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2.

Para ajustar el Modelo 2, se deben especificar las ventanas como en la Figura 65 y la

Figura 66. El Modelo 3 se especifica como en la Figura 65 y la Figura 67. El Modelo 4

se especifica como el anterior más el agregado de varianzas residuales heterogéneas

como en la Figura 68. El Modelo 5 se especifica con las ventanas presentadas en la

Figura 65, la Figura 67 y la Figura 69. El Modelo 6 es como el Modelo 5 más la

especificacion de varianzas residuales heterogéneas (Figura 68). El modelo 7 se

especifica como se muestra en la Figura 65, Figura 68 y Figura 70).

Page 103: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

99

Figura 66: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos del archivo CapacidadRespiratoria.IDB2.

Page 104: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

100

Figura 67: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los datos del archivo CapacidadRespiratoria.IDB2.

Page 105: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

101

Figura 68: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo CapacidadRespiratoria.IDB2.

Page 106: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

102

Figura 69: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo CapacidadRespiratoria.IDB2.

Page 107: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

103

Figura 70: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del archivo CapacidadRespiratoria.IDB2.

Luego de ajustar los siguientes modelos estos son los resultados:

Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo CapacidadRespiratoria.IDB2.

Modelo Efecto

Aleatorio paciente

Correlación Residual

Varianzas residuales

heterogéneas en el tiempo

AIC BIC log lik

1 NO NO NO 968.94 1081.04 -458.47

2 NO Simetría

Compuesta NO 401.29 517.71 -173.65

3 NO AR1 NO 329.04 445.45 -137.52

4 NO AR1 SÍ 324.57 471.17 -128.28

5 SÍ AR1 NO 303.03 423.76 -123.52

6 SÍ AR1 SÍ 287.80 438.71 -108.90

7 NO Sin estructura SÍ 270.27 533.29 -74.14

Page 108: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

104

A partir del Cuadro 2 podemos observar que los modelos 6 y 7 presentan los valores

más bajos de AIC mientras que los modelos 5 y 6 presentan los valores más bajos para

BIC. Una prueba formal de cociente de verosimilitud para comparar los modelos 5 y 6

puede obtenerse mediante:

2 2(log lik modelo reducido - log lik modelo completo)

2( 123.52 108.90) 29.24

X

Como ambos modelos difieren en 7 parámetros (el Modelo 5 tiene una única varianza

residual y el Modelo 6 tiene 8 varianzas residuales), el estadístico de verosimilitud se

compara con un valor crítico de una distribución chi-cuadrado con 7 grados de libertad.

Al hacer esto con el calculador de probabilidades y cuantiles de InfoStat obtenemos un

p-valor de 0.0001, lo que nos lleva a escoger el modelo completo (Modelo 6).

La misma prueba se puede realizar con el menú Estadísticas>>Modelos lineales

generales y mixtos>> Análisis-exploración de modelos estimados. Para comparar ambos

modelos seleccionamos la solapa Modelos y obtenemos los siguientes resultados:

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 5 28 303.03 423.76 -123.52 6 35 287.80 438.71 -108.90 1 vs 2 29.23 0.0001

Los resultados de la prueba del cociente de verosimilitud indican que entre estos dos

modelos el mejor es el Modelo 6. Luego, resta solo comparar el Modelo 6 con el 7. En

este caso el modelo reducido es el 6 y el completo es el 7. Los resultados para esta

comparación son:

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 7 61 270.27 533.29 -74.14 6 35 287.80 438.71 -108.90 1 vs 2 69.53 <0.0001

Los resultados indican que el Modelo 7 es el mejor. Por lo tanto el modelo seleccionado

tiene una estructura de correlación residual sin estructura y varianzas residuales

heterogéneas en el tiempo. La salida completa para este modelo se presenta a

continuación:

Page 109: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

105

Modelos lineales generales y mixtos Especificación del modelo en R modelo009_Cap_Respirat_REML<-gls(Cap_Respirat~1+Droga+Hora+Droga:Hora+Cap_Resp_base ,weight=varComb(varIdent(form=~1|Hora)) ,correlation=corSymm(form=~as.integer(as.character(Hora))|Paciente_Droga) ,method="REML" ,na.action=na.omit ,data=R.data09) Resultados para el modelo: modelo009_Cap_Respirat_REML Variable dependiente:Cap_Respirat Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 576 270.27 533.29 -74.14 0.48 0.55 AIC y BIC menores implica mejor Pruebas de hipótesis marginales(SC tipo III) numDF F-value p-value (Intercept) 1 6.49 0.0111 Droga 2 7.25 0.0008 Hora 7 13.72 <0.0001 Cap_Resp_base 1 92.57 <0.0001 Droga:Hora 14 4.06 <0.0001 Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3936.01 <0.0001 Droga 2 13.87 <0.0001 Hora 7 13.72 <0.0001 Cap_Resp_base 1 92.57 <0.0001 Droga:Hora 14 4.06 <0.0001 Estructura de correlación Modelo de correlación: General correlation Formula: ~ as.integer(as.character(Hora)) | Paciente_Droga Matriz de correlación común 1 2 3 4 5 6 7 8 1 1.00 0.89 0.88 0.78 0.69 0.67 0.52 0.65 2 0.89 1.00 0.91 0.87 0.81 0.70 0.59 0.70 3 0.88 0.91 1.00 0.91 0.81 0.75 0.64 0.74 4 0.78 0.87 0.91 1.00 0.82 0.73 0.67 0.75 5 0.69 0.81 0.81 0.82 1.00 0.85 0.73 0.84 6 0.67 0.70 0.75 0.73 0.85 1.00 0.81 0.88 7 0.52 0.59 0.64 0.67 0.73 0.81 1.00 0.82 8 0.65 0.70 0.74 0.75 0.84 0.88 0.82 1.00

Page 110: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

106

Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Hora Parámetros de la función de varianza Parámetro Estim 1 1.00 2 1.07 3 1.06 4 1.15 5 1.12 6 1.07 7 1.09 8 1.15 Medias ajustadas y errores estándares para Droga LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Droga Medias E.E. B 3.33 0.09 A A 3.11 0.09 A P 2.82 0.09 B Letras distintas indican diferencias significativas(p<= 0.05) Medias ajustadas y errores estándares para Hora LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hora Medias E.E. 1 3.33 0.06 A 2 3.30 0.06 A 3 3.22 0.06 B 4 3.12 0.06 C 5 3.02 0.06 D 6 2.96 0.06 D 7 2.88 0.06 E 8 2.87 0.06 E Letras distintas indican diferencias significativas(p<= 0.05) Medias ajustadas y errores estándares para Droga*Hora LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Droga Hora Medias E.E. B 1 3.69 0.10 A B 2 3.63 0.10 A B B 3 3.58 0.10 A B A 1 3.47 0.10 A B C B 4 3.44 0.11 B C D A 2 3.39 0.10 B C D B 5 3.25 0.11 C D E A 3 3.18 0.10 D E F B 6 3.08 0.10 E F G

Page 111: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

107

A 5 3.05 0.11 E F G H A 4 3.04 0.11 E F G H B 8 3.01 0.11 E F G H I A 6 2.98 0.10 E F G H I B 7 2.98 0.11 F G H I P 3 2.90 0.10 F G H I P 2 2.89 0.10 G H I P 4 2.87 0.11 G H I A 7 2.87 0.11 G H I A 8 2.86 0.11 G H I P 1 2.83 0.10 G H I P 6 2.82 0.10 G H I P 7 2.79 0.11 H I P 5 2.77 0.11 H I P 8 2.73 0.11 I Letras distintas indican diferencias significativas(p<= 0.05)

Podemos ver que hay interacción significativa entre la droga y el tiempo (p<0.0001),

por lo que procederemos a realizar un Gráfico de interacción. Para realizar este gráfico

en primer lugar se copiaron las Medias ajustadas y errores estándares para

Droga*Hora y se pegaron en una nueva tabla de InfoStat. Esta tabla fue guardada como

MedCapRes.IDB2. Luego en el menú Gráficos>>Gráficos de puntos se declararon las

variables como se muestra a continuación (Figura 71 y Figura 72):

Figura 71: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2.

Page 112: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

108

Figura 72: Ventana de selector de variables con solapa Particiones activada para los datos del archivo MedCapRes.IDB2.

Es importante recalcar que debido a que los errores estándar de cada una de las

combinaciones de tratamientos y horas son diferentes éstos deben ser tenidos en cuenta

al momento de solicitar el gráfico. Esto se logra declarando la medida de error en la

subventana Error. Con estas especificaciones se obtiene el gráfico para estudiar la

interacción (Figura 73).

Page 113: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

109

Droga ADroga BPlacebo

1 2 3 4 5 6 7 8

Hora

2.60

2.70

2.80

2.90

3.00

3.10

3.20

3.30

3.40

3.50

3.60

3.70

3.80

Cap

acid

ad r

espi

rato

ria m

edia

Droga ADroga BPlacebo

Figura 73: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del archivo CapacidadRespiratoria.IDB2.

Podemos observar que mientras el placebo tiene una respuesta prácticamente constante,

las drogas A y B aumentan la capacidad respiratoria después de su aplicación. Esta

capacidad va disminuyendo con el tiempo, y siempre es superior el valor medio de la

droga B respecto a la droga A. Para encontrar diferencias significativas entre los

tratamientos en cada una de las horas se pueden realizar contrastes. En este caso, dentro

de cada hora se pueden probar hipótesis sobre igualdad de medias entre drogas y

placebo, y entre las dos drogas. Para la obtención de los contrastes (en este caso

ortogonales) se deben declara en la solapa Comparaciones, subsolapa Contrastes como

en la Figura 74.

Page 114: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

110

Figura 74: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo CapacidadRespiratoria.IDB2.

A continuación se presentan lo valores de probabilidad para los contrastes solicitados: Pruebas de hipótesis para contrastes Droga*Hora F gl(num) gl(den) p-valor Ct.1 40.08 1 551 <0.0001 Ct.2 2.54 1 551 0.1119 Ct.3 23.46 1 551 <0.0001 Ct.4 2.46 1 551 0.1170 Ct.5 14.55 1 551 0.0002 Ct.6 7.36 1 551 0.0069 Ct.7 7.39 1 551 0.0068 Ct.8 6.37 1 551 0.0119 Ct.9 8.11 1 551 0.0046 Ct.10 1.63 1 551 0.2022 Ct.11 2.86 1 551 0.0914 Ct.12 0.53 1 551 0.4651 Ct.13 1.09 1 551 0.2965 Ct.14 0.53 1 551 0.4656 Ct.15 2.13 1 551 0.1446 Ct.16 0.94 1 551 0.3319 Total 5.19 16 551 <0.0001

Page 115: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

111

Los Contrastes 1, 3, 5, 7 y 9 comparan el placebo con el promedio de las drogas para las

horas 1, 2, 3 ,4 y 5 respectivamente. Debido a que todos estos son significativos

(p<0.05) podemos decir que recién a la hora 6 de aplicadas las drogas estas pierden su

efecto, ya que los contrastes 11, 13 y 15 no son significativos. Respecto a la

comparación de las drogas entres sí, la superioridad de la B sobre la A se manifiesta

(p<0.05) solo en las horas 3 y 4 (contrastes 6 y 8 respectivamente).

Page 116: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

112

Análisis de bolsas de descomposición

En los ensayos de descomposición de hojarasca la materia seca remanente en cada

tiempo es analizada, generalmente, mediante ANCOVA, usando el tiempo como

covariable y transformación logarítmica de la respuesta, o ANOVA para un diseño en

parcelas divididas, cuando los periodos de evaluación son equi-distantes. Las unidades

de observación consisten en bolsas conteniendo el material vegetal. Usualmente estas

bolsas son agrupadas para conformar una repetición y permitir su evaluación a lo largo

del tiempo, evaluando el contenido de una bolsa en cada instancia de valoración.

Aunque en cada tiempo las bolsas evaluadas son distintas, en muchas ocasiones la

estructura de correlación que supone independencia o simetría compuesta (inducida por

la agrupación de bolsas que representan una repetición) no es suficiente para explicar

las correlaciones observadas. Las observaciones cercanas en el tiempo suelen estar más

correlacionadas que las lejanas, o las correlaciones entre observaciones en los primeros

tiempos son diferentes a las de los últimos. El uso de modelos mixtos permite no sólo

manejar estructuras de correlación más complejas sino también la posibilidad de

modelar varianzas heterogéneas. En estos modelos los tratamientos pueden ser incluidos

como factores de clasificación y el tiempo puede modelarse tanto como una covariable

o como un factor. Este último caso produce modelos menos parsimoniosos pero más

flexibles para modelar diferentes tendencias en el tiempo. Por otra parte, la introducción

de efectos aleatorios sobre los parámetros que involucran al tiempo puede ser usada

para corregir falta de ajuste.

En el ejemplo, que se presenta a continuación, se analizan un conjunto de datos

proveniente de un ensayo de descomposición realizado en ambiente acuático tropical

(Martinez 2006). Los tratamientos comparados consisten en: dos especies (Guadua sp. y

Ficus sp.) de las cuales se obtiene el material vegetal y dos tamaño de la trama de la

bolsa donde se coloca el material (tramado fino y grueso). Los cuatro tratamientos

contaron con 5 repeticiones (conteniendo 7 bolsas cada una) y fueron evaluados en 7

tiempos. El propósito de este ensayo fue establecer el efecto de los factores y el tiempo

sobre la tasa de descomposición. Los datos se encuentran en el archivo

Descomposición.IDB2.

Los datos originales (materia seca remanente) fueron transformados a logaritmos. El

gráfico del logaritmo de la materia seca remanente (en adelante la respuesta) en función

del tiempo y para cada tratamiento (Figura 75) muestra un decaimiento del peso seco

Page 117: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

113

remanente en función del tiempo. Se insinúa también una posible falta de

homoscedasticidad en función del tiempo y dependiente de la especie y el tramado de la

tela de la bolsa. Una primera aproximación a la modelación de estos datos podría ser el

ajuste de un modelo de regresión con ordenadas al origen y pendientes diferentes. Para

realizar este ajuste se invocó al módulo de modelos mixtos indicando como variable

dependiente al LnPesoSeco, como factores de clasificación a Especie y Bolsa y como

covariable al Tiempo. Luego en la solapa de la parte fija del modelo se indicaron los

términos que se presentan en la Figura 76. El gráfico del modelo ajustado se presenta en

la Figura 77.

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 10 20 30 40 50 60 70 80 90

Tiempo

-4.0

-3.5

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

Ln

Pe

soS

eco

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 75: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.

Page 118: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

114

Figura 76: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo para cuatro

tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Page 119: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

115

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 10 20 30 40 50 60 70 80 90

Tiempo

-4.0

-3.5

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

Ln

Pe

soS

eco

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 77: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.

La Figura 77 muestra que el ajuste de rectas específicas por tratamiento, es una

aproximación que, aunque plausible, no da cuenta de algunas particularidades de la

pérdida de peso seco. Esto se refleja en la presencia de curvatura en los residuos (Figura

78). Una forma de resolver el problema de la presencia de curvatura es la imposición de

un modelo que incluya términos cuadráticos para el tiempo. Para ello tendremos que

extender el modelo propuesto en Figura 76, incluyendo todos los términos

correspondientes al tiempo al cuadrado. Para simplificar la notación hemos creado tres

variables T1 y T2 que representan el tiempo y el tiempo al cuadrado y Especie_Bolsa

que identifica los cuatro tratamientos. T1 es el tiempo centrado respecto del valor 30

(días) y T2 el cuadrado de T1. La razón para centrar las covariables es romper la

colinealidad que resulta de utilizar una regresora y su cuadrado y mejorar la condición

de la matriz X’X. Las variables T1 y T2 así como Especie_Bolsa se incluyen en el

archivo Descomposición.IDB2. En la invocación del módulo de modelos mixtos debería

incluirse Especie_Bolsa como factor de clasificación y T1 y T2 como covariables.

Luego en la solapa de los efectos fijos del modelo debería verse como se muestra en la

Figura 79.

Page 120: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

116

0 10 20 30 40 50 60 70 80 90

Tiempo

-3.50

-1.75

0.00

1.75

3.50

RE

_0

_L

nP

eso

Se

co

Figura 78: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de

la materia seca residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes ordenadas y pendientes. Archivo Descomposición.IDB2.

Figura 79: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la

especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Page 121: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

117

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 10 20 30 40 50 60 70 80 90

Tiempo

-4.00

-3.50

-3.00

-2.50

-2.00

-1.50

-1.00

-0.50

0.00

0.50

1.00

1.50

Ln

Pe

soS

eco

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 80: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Los residuos del modelo ajustado según Figura 79, muestran dos problemas:

heteroscedasticidad (que depende del tiempo y los tratamientos) y falta de ajuste, ya que

para algunos tratamientos y tiempos, los residuos de Pearson aparecen por encima o por

debajo de la línea del cero (Figura 81).

En este punto optaremos por modelar primeramente, el problema de heteroscedasticidad

utilizando una función de varianza identidad. Para ello, en la ventana de especificación

del modelo dejaremos la parte fija tal cual se indicó en la Figura 79, pero en la solapa

Heteroscedasticidad indicaremos que la varianza debe ser estimada de manera diferente

para la combinación de tiempo y tratamiento según se muestra en la Figura 82. Los

residuos estudentizados vs. tiempo para este modelo se presentan en la (Figura 83). Aún

cuando se pudo subsanar, en gran medida, el problema de la heteroscedasticidad,

persisten problemas de falta de ajuste que se visualizan en conjuntos de residuos de un

único tratamiento en un tiempo dado que quedan ya sean todos positivos o negativos.

Page 122: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

118

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 23 45 68 90

Tiempo

-7.00

-6.00

-5.00

-4.00

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

4.00

Re

sid

uo

s L

nP

eso

Se

co (

Pe

ars

on

)

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 81: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en

función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Figura 82: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material

vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Page 123: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

119

Una forma de resolver esta falta de ajuste, es agregar efectos aleatorios sobre el nivel

medio para las combinaciones de tiempo y tratamientos. Si en la solapa Efectos

aleatorios agregamos Tiempo_Especie_Bolsa y dejamos tildado el casillero

correspondiente a la Constante estamos indicando que se trata de un corrimiento

aleatorio que afecta la ordenada al origen para cada conjunto de observaciones

correspondientes a la combinación Tiempo, Especie y Bolsa (Figura 84). Finalmente, el

gráfico de residuos estudentizados de este modelo muestra una imagen donde no hay

evidencia de falta de ajuste o presencia de heteroscedasticidad (Figura 85).

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 23 45 68 90

Tiempo

-2.50

-1.25

0.00

1.25

2.50

Re

sid

uo

s L

nP

eso

Se

co (

Pe

ars

on

)

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 83: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente

en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Page 124: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

120

Figura 84: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en

función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 10 20 30 40 50 60 70 80 90

Tiempo

-2.50

-1.25

0.00

1.25

2.50

Re

sid

uo

s L

nP

eso

Se

co (

Pe

ars

on

)

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 85: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para cada combinación de tiempo y tratamiento, para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos

dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Page 125: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

121

Finalmente, como el propósito de este ensayo fue calcular las tasas de descomposición y

lo que hemos ajustado es un modelo lineal para el logaritmo del peso de materia seca

remanente, podemos estimar la tasa de descomposición como la derivada de

-exp(modelo ajustado). Utilizaremos la interfase con R para obtener estas derivadas.

Apretando la tecla F9 se invoca la ventana del intérprete de R (Figura 86). A la derecha

de la ventana aparecerán una lista de los objetos R que se hayan creado durante la sesión

de trabajo. En esta lista debe aparecer el modelo ajustado utilizando el modulo de

modelos mixtos, el nombre de estos objetos es “modelo”+ número correlativo_nombre

de la variable dependiente_método de estimación. En nuestro ejemplo debería aparecer

modelo#_LnPesoSeco_REML (en la posición # debe haber un número que depende del

número de veces que se ajusto un modelo para la misma variable dependiente). En el

ejemplo figura el modelo modeloOO1_LnPesoSeco_REML.

Figura 86: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la salida de la ejecución de un script o de la visualización de un objeto, Objetos: la

lista de los objetos residente en la memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que envía R a la consola.

Para calcular las tasas de descomposición tenemos que comprender qué es lo que hemos

ajustado con el modelo lineal estimado. La parte fija de modelo propuesto fue:

Page 126: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

122

Especie_Bolsa

Especie_Bolsa*T1

Especie_Bolsa*T2

Este modelo especifica una regresión polinómica de segundo grado en el tiempo

(centrado alrededor de 30 días) para cada una de las combinaciones de Especie y

tramado de Bolsa. Así, lo que estimamos es una función de la forma:

2

0 1 2ln 30 30i i iPesoSeco T T (7)

Donde el índice i indica el tratamiento (en este caso i identifica a las cuatro

combinaciones de Especie y tramado de Bolsa). Es decir que vamos a tener una

ecuación como (7) específica para cada condición. Los coeficientes estimados de la

parte fija pueden obtenerse durante la estimación del modelo tildando, en la solapa

Efectos fijos, la opción Mostrar coeficientes de la parte fija.

Como vamos a utilizar R para calcular las derivadas de (7), revisaremos estos

coeficientes desde R. Si en la ventana Script escribimos:

Modelo004_LnPesoSeco_REML$coefficients$fixed

y apretamos al final de la línea Shift Enter aparecerá en el output la siguiente salida:

(Intercept) Especies_BolsaFicus_Grueso -0.7738921651 -0.5941956918 Especies_BolsaGuadua_Fino Especies_BolsaGuadua_Grueso 1.5901279280 1.5369627029 Especies_BolsaFicus_Fino:T1 Especies_BolsaFicus_Grueso:T1 -0.0326126598 -0.0508364778 Especies_BolsaGuadua_Fino:T1 Especies_BolsaGuadua_Grueso:T1 -0.0086055613 -0.0192635993 Especies_BolsaFicus_Fino:T2 Especies_BolsaFicus_Grueso:T2 0.0002938702 0.0004422140 Especies_BolsaGuadua_Fino:T2 Especies_BolsaGuadua_Grueso:T2

0.0000571603 -0.0002451274

Los primeros 4 coeficientes (leyendo de izquierda a derecha), corresponden a las

ordenadas al origen 0i de: Ficus_Fino, Ficus_Grueso, Guadua_Fino y

Page 127: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

123

Guadua_Grueso. La ordenada al origen de Ficus_Fino no aparece explícitamente porque

está confundido con la ordenada al origen (Intercept) que se supone presente por

defecto.

Los segundos 4 coeficientes (-0.0326126598,…,,-0.0192635993) son los coeficientes

1i del término lineal de (7) y los últimos 4 (0.0002938702,…, -0.0002451274) son

los coeficientes 2i del término cuadrático en (7). Luego, el peso seco remanente para

la Especie Ficus con Bolsa de tramado Fino la ecuación será:

2ln 0.7738921651 0.0326126598 ( 30) 0.0002938702( 30)PesoSeco T T

Como la función (7) representa el peso seco remanente, el peso descompuesto debería

calcularse como:

2

0 1 2exp 30 30i i iPesoSecoConsumido PesoInicial T T (8)

En tanto la tasa de descomposición, sería la derivada de esta función, es decir:

2

0 1 2 1 2exp 30 30 2 30i i i i iTasaDescomp T T T (9)

El siguiente script genera una tabla cuya primera columna es el tiempo y las restantes

las tasas de descomposición para cada uno de los tratamientos. Tener en cuenta que se

debe especificar el modelo que mejor ajustó (en nuestro caso modelo004):

a=modelo004_LnPesoSeco_REML$coefficients$fixed

T=seq(0,90,1)

dFF = -exp(a[1]+(T-30)*a[5]+(T-30)*(T-30)*a[9]) *(a[5]+2*(a[9] *(T-30)))

dFG = -exp(a[2]+(T-30)*a[6]+(T-30)*(T-30)*a[10])*(a[6]+2*(a[10]*(T-30)))

dGF = -exp(a[3]+(T-30)*a[7]+(T-30)*(T-30)*a[11])*(a[7]+2*(a[11]*(T-30)))

dGG = -exp(a[4]+(T-30)*a[8]+(T-30)*(T-30)*a[12])*(a[8]+2*(a[12]*(T-30)))

Tasas=as.data.frame=cbind(T,dFF,dFG,dGF,dGG)

Page 128: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

124

En la lista de objetos aparecerán los objetos a, T,

dFF, dFG, dGF, dGG y Tasas. Haciendo clic

sobre Tasas, con el botón derecho del ratón

aparecerá un menú de acciones entre las que se

encuentra Convertir matriz, data frame o vector

a tabla InfoStat. Seleccionando esta opción

obtendremos una nueva tabla InfoStat como la

que se muestra a la derecha de este párrafo.

Utilizando el submenú Diagrama de dispersión

en el menú Gráficos podemos obtener la

siguiente representación de las tasas de

descomposición (Figura 87). Para ello se

asignaron las variables dFF, dFG, dGF y dGG

al Eje Y y la variable T al Eje X, en la ventana de

diálogo emergente del submenú Diagrama de

dispersión.

Ficus Fino Ficus Grueso Guadua Fino Guadua Grueso

0 10 20 30 40 50 60 70 80 90

Tiempo

0.00

0.05

0.10

0.15

0.20

0.25

0.30

Ta

sa d

e d

esc

om

po

sici

ón

Ficus Fino Ficus Grueso Guadua Fino Guadua Grueso

Figura 87: Curvas de tasas de descomposición según especie y tramado de la bolsa de almacenamiento.

Page 129: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

125

Uso de modelos mixtos para el control de la variabilidad espacial en

ensayos agrícolas

Correlación espacial

La estratificación o bloqueo de parcelas es una técnica usada para controlar los efectos

de variación entre las unidades experimentales. Los bloques son grupos de unidades

experimentales formados de manera tal que las parcelas dentro de los bloques sean lo

más homogéneas posible. Los diseños con estratificación de parcelas tales como el

diseño en bloques completos aleatorizados (DBCA), los diseños en bloques incompletos

y los látices son más eficientes que el diseño completamente aleatorizado cuando las

diferencias entre unidades experimentales que conforman un mismo estrato (bloque) son

mínimas y las diferencias entre los estratos son máximas. Cuando esta condición no se

cumple puede ocurrir una sobrestimación de la varianza del error y, si los datos son

desbalanceados, también puede presentarse un sesgo en las estimaciones de los efectos

de tratamientos. Cuando se evalúan muchos tratamientos en parcelas a campo, el

tamaño de los bloques necesarios para lograr una repetición del ensayo es grande y por

tanto resulta difícil asegurar la homogeneidad de las parcelas que conforman el bloque;

las parcelas más próximas pueden ser más similares que las más distantes, generando

variabilidad espacial (Casanoves et ál. 2005). La variabilidad espacial se refiere a la

variación entre observaciones realizadas sobre parcelas con arreglos espaciales sobre el

terreno. Debido a la existencia de variabilidad espacial dentro de bloques, el análisis de

varianza estándar para los diseños que involucran el bloqueo de unidades

experimentales no siempre elimina los sesgos en las comparaciones de efectos de

tratamientos. La variación de parcela a parcela dentro de un mismo bloque puede

deberse a competencia, heterogeneidad en la fertilidad del suelo, dispersión de insectos,

malezas, enfermedades del cultivo o labores culturales, entre otros. Por este motivo se

han propuesto procedimientos estadísticos que contemplan la variación espacial entre

parcelas y que van desde el ajuste de medias de tratamientos en función de lo observado

en las parcelas vecinas más cercanas (Papadakis 1937), hasta el uso de modelos que

contemplan las correlaciones espaciales en términos del error y que también producen

ajustes de medias de tratamientos (Mead 1971, Besag 1974, 1977, Ripley 1981).

Gilmour et ál. (1997) particionan la variabilidad espacial entre parcelas de un ensayo en

variabilidad espacial local y global. La variabilidad espacial local hace referencia a las

Page 130: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

126

diferencias entre parcelas a pequeña escala, donde se contemplan las variaciones intra-

bloque. La tendencia espacial local y la heterogeneidad residual se modelan mediante la

matriz de varianza y covarianza residual. A través de un sistema de coordenadas

bidimensionales es posible definir la ubicación de las parcelas en el campo.

La modelación de la estructura espacial de parcelas a partir de funciones de distancia

puede realizarse en el contexto de los modelos lineales mixtos (Zimmerman y Harville

1991, Gilmour et ál. 1997, Cullis et ál. 1998), donde además de contemplar la estructura

de correlación entre observaciones provenientes de distintas parcelas es posible modelar

heterogeneidad de varianza residual. Esto es muy útil en los ensayos comparativos de

rendimiento ya que estos se llevan a cabo en distintos ambientes. Si la correlación solo

depende de la distancia (magnitud y/o dirección de las distancias), los modelos que

estiman las covarianzas entre observaciones se denominan estacionarios. Las funciones

de correlación para modelos estacionarios pueden ser isotrópicas o anisotrópicas. Las

primeras son idénticas en cualquier dirección (sólo dependen de la magnitud de las

distancias) mientras que las segundas permiten diferentes valores de sus parámetros en

diferentes direcciones (i.e. dependen también de la dirección sobre la cual se calculan

las distancias).

Análisis de un ensayo comparativo de rendimientos en maní

Para ejemplificar las alternativas de análisis usaremos los datos que se encuentran en el

archivo ECRmaní.IDB2 y provienen de un año agrícola de un ensayo comparativo de

rendimientos (ECR) de líneas experimentales (genotipos) de maní (Arachis hypogaea

L.) del Programa de Mejoramiento de Maní de la EEA-Manfredi, INTA, Argentina. En

cada campaña los ECR se realizaron en tres localidades del área de cultivo en la

provincia de Córdoba: Manfredi, General Cabrera y Río Tercero. El conjunto de líneas

evaluadas fue el mismo para cada localidad. En cada una de las tres localidades los

ensayos fueron conducidos según un DBCA con cuatro repeticiones, registrándose los

valores de rendimiento en grano (kg/parcela).

Los datos de rendimiento fueron analizados usando distintas modificaciones del

siguiente modelo:

; 1,..,16; 1,...,4; 1,...,3ijk i j k jk ik ijkly i j k (10)

Page 131: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

127

donde ijky representa la respuesta observada en i-ésimo nivel del factor genotipo,

j-ésimo nivel de factor bloque, y k-ésimo nivel del factor localidad, representa la

media general de la respuesta, i representa el efecto del i-ésimo nivel del factor

genotipo, j representa el efecto del j-ésimo nivel del factor bloque, k el k-ésimo nivel

del factor localidad y ik la interacción entre los factores genotipo y localidad, ik el

efecto de bloque dentro de localidad, y ijkl representa el error experimental. La

suposición usual es que 2~ 0,ijkl N .

Excepto por ijk y los efectos de bloque (cuando son considerados aleatorios) en la

mayoría de los casos, todos los factores del modelo serán considerados como de efectos

fijos. Esto tiene la finalidad de restringir la comparación de los modelos a su estructura

de parcelas. Las distintas estructuras de parcela inducen una estructura de correlación

entre las observaciones que puede ser contemplada en el marco de los modelos mixtos,

incluyendo técnicas de análisis para el control de la variabilidad espacial.

Se usarán las siguientes estructuras de covarianza para los datos (covarianza marginal):

1. Modelo BF: Efecto de Bloques fijos, errores independientes y varianza entre localidades constante.

2. Modelo BA: Efecto de Bloques aleatorios, errores independientes y varianza entre localidades constante.

3. Modelo BFH: Efecto de Bloques fijos, errores independientes y varianzas diferentes entre localidades.

4. Modelo BAH: Efecto de Bloques aleatorios, errores independientes y varianzas diferentes entre localidades.

5. Modelo Exp: Correlación espacial exponencial sin efecto de bloques y varianza entre localidades constante.

6. Modelo BFExp: Correlación espacial exponencial, efecto de bloques fijos, y varianza entre localidades constante.

7. Modelo ExpH: Correlación espacial exponencial sin efecto de bloques y varianzas diferentes entre localidades.

8. Modelo Gau: Correlación espacial Gaussiana sin efecto de bloques y varianza entre localidades constante.

9. Modelo Esf: Correlación espacial esférico sin efecto de bloques y varianza entre localidades constante.

En los dos primeros modelos los ijk se asumirán como independientes con varianza

constante 2, i.e. se supone que no existe variación espacial local (intrabloque) y

además existe homogeneidad de varianzas residuales entre localidades. Los efectos de

Page 132: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

128

bloque serán considerados fijos y aleatorios, denotando los procedimientos como

Modelo BF y Modelo BA respectivamente.

Los procedimientos denotados como Modelo BFH y Modelo BAH se basarán también

en un modelo para un DBCA pero contemplando la posibilidad de varianzas residuales

heterogéneas según los distintos niveles del factor localidad.

El quinto procedimiento consistirá en ajustar para cada localidad un modelo de

correlación espacial isotrópico con función de correlación potencia (Modelo Exp) sin

declarar el efecto de bloques. Este modelo supone que la función exponencial no solo

contemplará la variación intrabloque sino también la variación entre bloques.

El sexto procedimiento fue igual al anterior pero agregando un efecto fijo de bloque

(Modelo BFExp).

El séptimo modelo consistió en un modelo como el Exp pero permitiendo la posibilidad

de varianzas (y correlaciones) diferentes para cada localidad.

Los dos últimos procedimiento consistirán en ajustar para cada localidad un modelo de

correlación espacial isotrópico con función de correlación Gaussiana (Modelo Gau) y

con función de correlación Esférica, sin declarar el efecto de bloques.

En todos los casos se utilizó estimación REML. En el selector de variables se indica al

rendimiento (Rendim) como dependiente y bloque, local y geno como clasificatorias.

Para ajustar el Modelo BF, en la solapa de efectos fijos se deben declarar los efectos

como se muestra en la Figura 88. No se declara nada en el resto de las solapas.

Para ajustar el Modelo BA, en la solapa efectos fijos y efectos aleatorios debe declararse

los factores como se presenta en la Figura 89 y Figura 90 respectivamente. No se

declara nada en el resto de las solapas.

Page 133: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

129

Figura 88: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BF.

Figura 89: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BA.

Page 134: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

130

Figura 90: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BA.

Los modelos BFH y BAH contemplan errores independientes y varianzas entre

localidades diferentes. Para especificar estos modelos, se procede igual que en los dos

casos anteriores (i.e. BF y BA) pero agregando una función varIdent en la solapa

Heteroscedasticidad, indicando como criterio de agrupamiento a la localidad (local).

Una vez declarada la función y el criterio de agrupamiento hacer clic en Agregar

(Figura 91).

Page 135: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

131

Figura 91: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y los Modelos BFH y BAH.

El quinto modelo no incluye el efecto de bloque y modela la variabilidad entre bloques

e intra-bloque por medio de una función exponencial isotrópica (modelo Exp) con

varianzas constantes entre localidades. Par usar la función exponencial deberemos

agregar al modelo las variables que denotan las coordenadas espaciales. Para esto en el

selector de variables debemos colocar las variables la y lon en Covariables. En la solapa

Efectos fijos dejamos geno, local y geno*local y en la solapa Efectos aleatorios no se

declara ningún factor. En la solapa Heteroscedasticidad no debe quedar ninguna

función declarada. Para declarar la correlación espacial tipo exponencial, en la solapa

Correlación se debe seleccionar la función correspondiente y declarar las coordenadas

en X y en Y, y el criterio de agrupamiento, en este caso local, ya que hay un sistema de

coordenadas dentro de cada localidad (Figura 92).

Page 136: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

132

Figura 92: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e Y respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y

los Modelos Exp y BFExp.

El sexto modelo, Modelo BFExp, es igual que el anterior pero declarando los efectos de

bloque dentro de localidad como fijos (como en la Figura 88). La inclusión de los

bloques fijos restringe la modelación de la variación espacial únicamente a la variación

dentro de bloque. La variación entre bloques está siendo contemplada, en un sentido

clásico, por la inclusión de los bloques en la parte fija. Así, declarar como coordenadas

del modelo de correlación espacial a la y lon, parece redundante ya que bastaría con

declarar sólo lon (coordenada que varia dentro de bloque). Sin embargo para omitir la

coordenada la sería necesario declara un nuevo criterio de estratificación consistente en

la combinación de los niveles de local y bloque. Esta forma alternativa produce

idénticos resultados a los mostrados en el modelo BFExp.

El séptimo modelo, modelo ExpH, es como el modelo Exp pero permitiendo varianzas

heterogéneas entre las localidades (como en la Figura 91). Los modelos Gau y Esf se

ajustan al igual que el Exp sin el efecto de bloque, y como se muestra en la Figura 92,

Page 137: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

133

pero eligiendo la función de correlación espacial Gaussiana y esférica respectivamente.

En la solapa Heteroscedasticidad no debe quedar nada declarado.

A continuación se presentan las salidas con las medidas de ajuste de los diferentes

modelos.

Modelo BF Modelos lineales generales y mixtos Especificación del modelo en R modelo000_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo000_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 299.71 468.22 -91.86 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 8372.75 <0.0001 local 2 280.56 <0.0001 geno 15 6.02 <0.0001 local:geno 30 4.32 <0.0001 local:bloque 9 4.77 <0.0001

Modelo BA Modelos lineales generales y mixtos Especificación del modelo en R modelo001_rendim_REML<-lme(rendim~1+local+geno+local:geno ,random=list(bloque_local=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_rendim_REML Variable dependiente:rendim

Page 138: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

134

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 192 283.41 431.90 -91.71 0.35 0.81 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 135 1754.21 <0.0001 local 2 9 58.78 <0.0001 geno 15 135 6.02 <0.0001 local:geno 30 135 4.32 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|bloque_local Desvíos estándares relativos al residual y correlaciones (const) (const) 0.49

Modelo BFH Modelos lineales generales y mixtos Especificación del modelo en R modelo002_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,weight=varComb(varIdent(form=~1|local)) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo002_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 303.44 477.75 -91.72 0.36 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 8547.37 <0.0001 local 2 292.67 <0.0001 geno 15 6.02 <0.0001 local:geno 30 4.36 <0.0001 local:bloque 9 4.76 <0.0001 Estructura de varianzas

Page 139: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

135

Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.92 rio3 0.96

Modelo BAH Modelos lineales generales y mixtos Especificación del modelo en R modelo003_rendim_REML<-lme(rendim~1+local+geno+local:geno ,random=list(bloque_local=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|local)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo003_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 192 287.12 441.55 -91.56 0.36 0.81 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 135 1765.74 <0.0001 local 2 9 59.53 <0.0001 geno 15 135 6.01 <0.0001 local:geno 30 135 4.36 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|bloque_local Desvíos estándares relativos al residual y correlaciones (const) (const) 0.46 Estructura de varianzas

Page 140: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

136

Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.92 rio3 0.95

Modelo Exp Modelos lineales generales y mixtos Especificación del modelo en R modelo004_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo004_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 273.43 421.92 -86.72 0.39 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1687.54 <0.0001 geno 15 7.27 <0.0001 local 2 56.18 <0.0001 geno:local 30 5.33 <0.0001 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.96

Page 141: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

137

Modelo BFExp Modelos lineales generales y mixtos Especificación del modelo en R modelo005_rendim_REML<-gls(rendim~1+geno+local+local:geno+local/bloque ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo005_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 284.85 456.26 -83.42 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 2785.57 <0.0001 geno 15 7.86 <0.0001 local 2 92.79 <0.0001 geno:local 30 5.74 <0.0001 local:bloque 9 3.46 0.0007 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.78

Page 142: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

138

Modelo ExpH Modelos lineales generales y mixtos Especificación del modelo en R modelo006_rendim_REML<-gls(rendim~1+geno+local+local:geno ,weight=varComb(varIdent(form=~1|local)) ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo006_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 275.01 429.44 -85.50 0.43 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1633.46 <0.0001 geno 15 7.15 <0.0001 local 2 61.51 <0.0001 geno:local 30 5.53 <0.0001 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.99 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.85 rio3 0.81

Page 143: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

139

Modelo Gau

Modelos lineales generales y mixtos Especificación del modelo en R modelo007_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corGaus(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo007_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 277.81 426.30 -88.90 0.37 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3399.06 <0.0001 geno 15 7.36 <0.0001 local 2 113.57 <0.0001 geno:local 30 4.97 <0.0001 Estructura de correlación Modelo de correlación: Gaussian spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.87

Page 144: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

140

Modelo Esf Modelos lineales generales y mixtos Especificación del modelo en R modelo008_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corSpher(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo008_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 277.72 426.21 -88.86 0.38 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3170.04 <0.0001 geno 15 7.61 <0.0001 local 2 105.96 <0.0001 geno:local 30 5.15 <0.0001 Estructura de correlación Modelo de correlación: Spherical spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 1.91

Comparación de los modelos ajustados

Debido a que los modelos ajustados tienen distintas componentes en su parte fija, se

compararán por medio de los criterios AIC y BIC aquellos que comparten los mismos

efectos fijos. En primer lugar se comparan entonces el BF, BFH y BFExp (Cuadro 3).

Page 145: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

141

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo ECRmani.IDB2

Modelo AIC BIC

BF 299.72 468.22

BFH 303.44 477.75

BFExp 284.85 456.26

Para este grupo de modelos que contemplan efecto de bloques fijos se puede ver que el

modelo con bloques fijos más una función de correlación exponencial provee el mejor

ajuste. Esto implica la existencia de una correlación intra-bloque que es removida por la

función de correlación exponencial. También se puede observar que no hay una mejora

en estos modelos al permitir varianzas heterogéneas entre localidades (BF respecto a

BFH). Si se calculan las varianzas a partir de los coeficientes para las distintas

localidades se puede ver que estas son realmente similares:

Varianza de gralcabr = (1*0.36)2 = 0.129

Varianza de manf = (0.92*0.36)2 = 0.109

Varianza de rio3 = (0.96*0.36)2 = 0.119

Los restantes 6 modelos se pueden comparar entre sí ya que todos comparten los

mismos efectos fijos, i.e. geno, local y geno*local (Cuadro 4).

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo ECRmani.IDB2

Modelo AIC BIC

BA 283.41 431.90

BAH 287.12 441.55

Exp 273.43 421.92

ExpH 275.01 429.44

Gau 277.81 426.30

Esf 277.72 426.21

Page 146: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

142

Dentro de los modelos que contemplan efectos de bloque aleatorio se puede ver

nuevamente que al permitir varianzas heterogéneas entre localidades el modelo no

mejora, ya que AIC y BIC son más pequeños en BA comparados con BAH. Lo mismo

ocurre cuando sólo se modela la variabilidad espacial por medio de una función de

correlación exponencial, ya que al permitir varianzas heterogéneas (ExpH) no se logra

una mejoría respecto a Exp.

Comparando distintos modelos de correlación espacial, no se encontraron diferencias

importantes para AIC y BIC entre los modelos Gau y Esf, pero estos criterios tuvieron

valores inferiores para la función de correlación espacial exponencial. Este último

modelo fue el de mejor ajuste dentro de los modelos sin efecto de bloque fijo.

Si bien el primer grupo de modelos (BF, BFH y BFExp) no son comparables por medio

de AIC y BIC con este último grupo, el investigador deberá poder discernir si sus

bloques deben ser considerados fijos o aleatorios. La elección de uno u otro grupo de

modelos tendrá efecto sobre las inferencias que se realicen. Esto se visualiza fácilmente

al ver que los errores estándar usados para las comparaciones de medias cambian entre

los modelos. Una discusión más detallada sobre la elección de bloques fijos o aleatorios

puede encontrarse en Casanoves et ál. (2007).

En este ejemplo los mejores modelos dentro de cada grupo (i.e. BFExp y Exp para el

primero y segundo grupo de modelos respectivamente) tienen la misma estructura de

covarianza pero difieren en su parte fija: unos contienen el efecto de bloque y otros no.

Para decidir cuál de los dos modelos es el que conviene, podemos realizar una prueba de

cociente de verosimilitudes, usando las estimaciones por ML para los modelos con y sin

efectos de bloque (recordemos que para comparar modelos con distintos efectos fijos se

debe usar ML):

Modelo con bloque (completo BFExp):

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 163.82 356.01 -22.91 0.29 0.86 AIC y BIC menores implica mejor

Modelo sin bloque (reducido Exp):

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 182.85 345.73 -41.43 0.34 0.81 AIC y BIC menores implica mejor

Page 147: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

143

Así, el estadístico 2log lik 2log lik 2( 22.91 41.43) 37.04completo reducidoG con 9

grados de libertad, y un valor p<0.0001, por lo que podemos decir, con una

significancia del 5%, que conviene dejar el efecto de bloques fijos y la función de

correlación exponencial. La comparación se puede hacer manualmente, o utilizando el

módulo Análisis exploratorio de un modelo estimado. Seleccionando la solapa, Modelos

y tildando los modelos estimados correspondientes a BFExp y ExP, se obtienen la salida

mostrada a continuación.

Comparación de modelos Model df logLik Test L.Ratio p-value modelo009_rendim_ML 1 59 -22.91 modelo010_rendim_ML 2 50 -41.43 1 vs 2 37.04 <0.0001

A continuación se presenta la salida completa correspondiente al modelo BFExp. Las

pruebas de hipótesis para la interacción entre genotipo y localidad son significativas

(p<0.0001) por lo que la recomendación de un genotipo puede cambiar dependiendo de

la localidad. Puede observarse que debido al ajuste de la función de correlación espacial

los EE de los genotipos no son únicos. Las comparaciones múltiples presentadas se

realizaron mediante la aplicación del procedimiento DGC (Di Rienzo et ál. 2002). Esta

procedimiento fue adaptado para contemplar las particularidades de la estructura de

correlación entre estimaciones emergente de los modelos mixtos. La aplicación de este

procedimiento es recomendada por el gran número de medias a comparar, ya que

asegura una interpretación más sencilla que la que puede obtenerse de la aplicación de

un test tipo LSD de Fisher. Para hacer recomendaciones se pueden usar las

comparaciones de medias de las combinaciones de localidades y genotipos como así

también el grafico de interacción (Figura 93).

Modelos lineales generales y mixtos Especificación del modelo en R modelo010_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data03)

Page 148: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

144

Resultados para el modelo: modelo010_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 284.85 456.26 -83.42 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 2785.57 <0.0001 local 2 92.79 <0.0001 geno 15 7.86 <0.0001 local:geno 30 5.74 <0.0001 local:bloque 9 3.46 0.0007 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.78 Medias ajustadas y errores estándares para local DGC (alfa=0.05) local Medias E.E. manf 3.00 0.08 A gralcabr 2.27 0.08 B rio3 1.56 0.08 C Letras distintas indican diferencias significativas(p<= 0.05) Medias ajustadas y errores estándares para geno DGC (alfa=0.05) geno Medias E.E. mf435 2.73 0.10 A mf407 2.59 0.10 A mf429 2.51 0.10 A mf415 2.49 0.10 A mf420 2.38 0.10 B mf421 2.36 0.10 B mf431 2.34 0.10 B mf405 2.31 0.10 B manf68 2.24 0.10 B mf408 2.22 0.10 B manf393 2.22 0.10 B colirrad 2.21 0.10 B mf404 2.14 0.10 B mf433 1.96 0.10 C mf432 1.96 0.10 C mf410 1.78 0.10 C Letras distintas indican diferencias significativas(p<= 0.05)

Page 149: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

145

Medias ajustadas y errores estándares para local*geno DGC (alfa=0.05) local geno Medias E.E. manf mf407 3.67 0.17 A manf mf421 3.54 0.17 A manf mf405 3.38 0.17 B manf mf431 3.28 0.17 B manf mf435 3.24 0.17 B manf manf68 3.23 0.17 B manf mf420 3.17 0.17 B manf mf429 3.08 0.17 B manf colirrad 3.05 0.17 B manf manf393 3.02 0.17 B gralcabr mf435 2.96 0.17 B manf mf408 2.90 0.17 B manf mf415 2.90 0.17 B gralcabr mf420 2.82 0.17 B gralcabr mf404 2.71 0.17 C manf mf433 2.64 0.17 C gralcabr mf415 2.61 0.17 C manf mf410 2.53 0.17 C gralcabr mf429 2.52 0.17 C manf mf432 2.48 0.17 C gralcabr mf421 2.42 0.17 C gralcabr mf408 2.32 0.17 C gralcabr manf393 2.30 0.17 C gralcabr mf407 2.30 0.17 C gralcabr mf405 2.25 0.17 C gralcabr mf431 2.05 0.17 D gralcabr manf68 2.04 0.17 D rio3 mf435 1.99 0.17 D rio3 mf415 1.98 0.17 D manf mf404 1.97 0.17 D rio3 mf429 1.93 0.17 D gralcabr colirrad 1.92 0.17 D rio3 mf432 1.89 0.17 D rio3 mf407 1.81 0.17 D gralcabr mf410 1.79 0.17 D gralcabr mf433 1.77 0.17 D rio3 mf404 1.74 0.17 D rio3 mf431 1.70 0.17 D rio3 colirrad 1.64 0.17 D gralcabr mf432 1.50 0.17 E rio3 mf433 1.47 0.17 E rio3 manf68 1.45 0.17 E rio3 mf408 1.44 0.17 E rio3 manf393 1.33 0.17 E rio3 mf405 1.32 0.17 E rio3 mf420 1.16 0.17 E rio3 mf421 1.14 0.17 E rio3 mf410 1.02 0.17 E Letras distintas indican diferencias significativas(p<= 0.05)

Page 150: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

146

Manfredi General Cabrera Río Tercero

mf4

04

mf4

32

mf4

10

mf4

33

mf4

15

man

f393

mf4

08

mf4

29

colir

rad

mf4

20

mf4

31

man

f68

mf4

35

mf4

05

mf4

21

mf4

07

Genotipo

0

1

2

3

4

Re

nd

imie

nto

(kg

/pa

rce

la)

Manfredi General Cabrera Río Tercero

Figura 93: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la variable rendimiento.

Page 151: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

Aplicaciones de modelos mixtos en otros diseños experimentales

Diseño en franjas (strip-plot)

El diseño strip-plot es un resultado de las restricciones a la aleatorización. Al igual que

en el diseño en parcelas divididas, el strip-plot es un resultado de cómo fue llevado a

cabo un experimento que involucra dos o más factores. Estos factores (o sus

combinaciones) se aplican en diferentes etapas, generalmente 2, y las restricciones a la

aleatorización producen las unidades experimentales de diferentes tamaños y por ende

diferentes términos de error para cada una de los factores o sus combinaciones (Milliken

y Johnson 1984).

Consideremos un ejemplo donde se desean evaluar tres niveles de fertilización con N (0,

50 y 100 kg N/ha) y dos niveles de riego (bajo y alto) sobre los rendimientos de maíz.

El ensayo se condujo bajo un diseño en bloques completos al azar con cuatro bloques

(datos: StripPlot.IDB2).

Debido a restricciones de la aplicación de los tratamientos, en una primera etapa, en

cada uno de los bloques, se aleatorizan los tres niveles de nitrógeno y en la segunda

etapa, en cada bloque y en sentido trasversal al sentido de aplicación de los niveles de

nitrógeno, se aleatorizan los niveles del factor riego.

Si bien en el siguiente esquema (Figura 94).se presenta la aleatorización dentro de un

bloque en particular, el experimento ha sido repetido en bloques, esquema necesario

para poder obtener los distintos términos de error y que el modelo resultante tenga

sentido. Si en cada etapa del diseño hubiera más de un factor, y estos no interactuaran

entre sí, se podrían usar las interacciones de más alto orden como términos de error y así

poder obtener las pruebas F sin necesidad de repeticiones.

Page 152: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

148

Etapa 1

100 kg N/ha

0 kg N/ha

50 kg N/ha

Etapa 2

Riego alto Riego bajo

Figura 94: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques completos al azar, con la aleatorización para un bloque particular de los factores cantidad de

nitrógeno y cantidad de riego. Datos del archivo StripPlot.IDB2.

Los datos de rendimiento se analizaron usando el siguiente modelo:

; 1,..,3; 1,2; 1,...,4ijk i j k ik jk ij ijky i j k (11)

donde ijky representa la respuesta observada en el i-ésimo nivel del factor nitrógeno,

j-ésimo nivel de factor riego y k-ésimo nivel del factor bloque, representa la media

general de la respuesta, i representa el efecto del i-ésimo nivel del factor nitrógeno, j

representa el efecto del j-ésimo nivel del factor riego, k el k-ésimo nivel del factor

Page 153: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

149

bloque, ik el efecto del bloque k en el nivel i de nitrógeno (efecto aleatorio con el que

se construye el término de error para nitrógeno), jk el efecto del bloque k en el nivel j

de riego (término de error para riego), ij la interacción entre los factores nitrógeno y

riego, y ijk representa el error residual (término de error para nitrógeno×riego). La

suposición usual es que 2 2 2~ 0, , ~ 0, y ~ 0,ik jk ijklN N N , siendo todos

independientes.

Este modelo puede ajustarse en InfoStat en el menú Análisis de varianza, de efectos

fijos, declarando al rendimiento como variable dependiente y a riego, nitrógeno y

bloque como variables clasificatorias. Luego, en la solapa Modelo se declaran los

siguientes factores indicando su correspondiente término de error (Figura 95).

Figura 95: Ventana del procedimiento de Análisis de varianza con la solapa Modelo desplegada para los datos del archivo StripPlot.IDB2.

A continuación se presenta la salida correspondiente al análisis de la varianza

tradicional.

Page 154: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

150

Análisis de la varianza Variable N R² R² Aj CV Rendimiento 24 0.99 0.97 1.65 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor (Error) Modelo 1177.38 17 69.26 48.41 0.0001 Bloque 123.46 3 41.15 28.77 0.0006 Nitrogeno 339.08 2 169.54 60.13 0.0001 (Bloque*Nitrogeno) Bloque*Nitrogeno 16.92 6 2.82 1.97 0.2147 Riego 570.38 1 570.38 52.18 0.0055 (Bloque*Riego) Bloque*Riego 32.79 3 10.93 7.64 0.0179 Nitrogeno*Riego 94.75 2 47.38 33.12 0.0006 Error 8.58 6 1.43 Total 1185.96 23 Test:LSD Fisher Alfa=0.05 DMS=2.05433 Error: 2.8194 gl: 6 Nitrogeno Medias n 0 68.25 8 A 50 71.75 8 B 100 77.38 8 C Letras distintas indican diferencias significativas(p<= 0.05) Test:LSD Fisher Alfa=0.05 DMS=4.29543 Error: 10.9306 gl: 3 Riego Medias n Bajo 67.58 12 A Alto 77.33 12 B Letras distintas indican diferencias significativas(p<= 0.05) Test:LSD Fisher Alfa=0.05 DMS=2.06945 Error: 1.4306 gl: 6 Nitrogeno Riego Medias n 0 Bajo 61.50 4 A 50 Bajo 66.00 4 B 0 Alto 75.00 4 C 100 Bajo 75.25 4 C 50 Alto 77.50 4 D 100 Alto 79.50 4 D Letras distintas indican diferencias significativas(p<= 0.05)

Se encontró efecto de nitrógeno (p=0.0001), de riego (p=0.0055) y también interacción

nitrogeno×riego (p=0.0006). Para estudiar la interacción se realizó un gráfico de puntos

(Figura 96).

Page 155: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

151

Riego Alto

Riego Bajo

0 50 100

Nitrogeno

55

60

65

70

75

80

Re

nd

imie

nto

Riego Alto

Riego Bajo

Figura 96: Diagramas de puntos para estudiar la interacción entre Riego y Nitrógeno y su efecto sobre el rendimiento. Datos archivo StripPlot.IDB2.

A partir del gráfico de interacción y de las medias de los tratamientos se recomienda el

riego alto con fertilización de nitrógeno de 50 kg, ya que esta combinación no difiere

estadísticamente de 100 kg de nitrógeno con riego alto y ambas difieren del resto.

Este ensayo pudo evaluarse bajo la óptica de los modelos lineales fijos debido a que está

completamente balanceado. Estos datos también pueden analizarse como modelos

mixtos como se detalla a continuación. Si hubiera existido desbalance o si los bloques

hubiesen sido aleatorios, este enfoque es el único válido.

Este modelo puede ajustarse en InfoStat en el menú Modelos lineales generales y

mixtos, declarando a rendimiento como variable dependiente y a riego, nitrógeno y

bloque como variables clasificatorias. Luego, en la solapa Efectos fijos se declaran los

siguientes términos (Figura 97).

Page 156: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

152

Figura 97: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo StripPlot.IDB2 .

En la solapa Efectos aleatorios se debe declarar el efecto de bloque tanto en la constante

( k ) como en los factores fijos nitrógeno y riego ( ik y jk respectivamente) (Figura 98).

Page 157: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

153

Figura 98: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del archivo StripPlot.IDB2 .

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Rendimiento_REML<-lme(Rendimiento~1+Nitrogeno+Riego+Nitrogeno:Riego ,random=list(Bloque=pdIdent(~1) ,Bloque=pdIdent(~Nitrogeno-1) ,Bloque=pdIdent(~Riego-1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 24 106.09 115.00 -43.05 1.20 0.85 0.94 0.95 0.99 AIC y BIC menores implica mejor

Page 158: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

154

Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 15 3061.88 <0.0001 Nitrogeno 2 15 60.13 <0.0001 Riego 1 15 52.18 <0.0001 Nitrogeno:Riego 2 15 33.12 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 1.83 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Nitrogeno - 1|Bloque Desvíos estándares relativos al residual y correlaciones 0 100 50 0 0.70 0.00 0.00 100 0.00 0.70 0.00 50 0.00 0.00 0.70 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Riego - 1|Bloque Desvíos estándares relativos al residual y correlaciones Alto Bajo Alto 1.49 0.00 Bajo 0.00 1.49 Medias ajustadas y errores estándares para Nitrogeno LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Nitrogeno Medias E.E. 100 77.38 1.40 A 50 71.75 1.40 B 0 68.25 1.40 C Letras distintas indican diferencias significativas(p<= 0.05) Medias ajustadas y errores estándares para Riego LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Riego Medias E.E. Alto 77.33 1.47 A Bajo 67.58 1.47 B Letras distintas indican diferencias significativas(p<= 0.05)

Page 159: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

155

Medias ajustadas y errores estándares para Nitrogeno*Riego LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Nitrogeno Riego Medias E.E. 100 Alto 79.50 1.59 A 50 Alto 77.50 1.59 A B 100 Bajo 75.25 1.59 B C 0 Alto 75.00 1.59 C 50 Bajo 66.00 1.59 D 0 Bajo 61.50 1.59 E Letras distintas indican diferencias significativas(p<= 0.05)

Podemos observar que bajo el enfoque de modelos mixtos en este experimento se llega

a las mismas conclusiones que en el enfoque clásico y que los estadísticos F para las

pruebas de efectos fijos son los mismos, pero los grados de libertad del denominador

son diferentes. Debemos destacar que los modelos no son absolutamente equivalentes,

ya que en el enfoque de modelos mixtos los bloques son aleatorios y en el clásico son

fijos; y que las fórmulas para el cálculo de los grados de libertad del denominador en los

estadísticos F son diferentes.

Page 160: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

156

Diseño experimental con dos factores y dependencia espacial

En muchas situaciones se presentan niveles de un factor de interés que, por su

naturaleza, no se pueden asignar en forma aleatoria. Este es el caso de las tomas de

muestras de agua a lo largo de un río, cuando se evalúan efectos a distintas distancias en

un bosque o cuando se toman muestras de suelo a distintas profundidades. El hecho de

que no se puedan aleatorizar los niveles de un factor genera una dependencia espacial

que debe ser contemplada. Aquí presentamos un ejemplo (datos Lombrices.IDB2) en

donde se evalúan cuatro tipo de sombra en cultivos de café: testigo con sol (sol),

leguminosa1 (SombraL1), leguminosa2 (SombraL2) y no leguminosa (SombraNL) en

tres profundidades (1=0-10 cm, 2=10-20 cm y 3=20-30 cm). En cada una de las

unidades experimentales (combinación de tratamientos y repeticiones) se tomaron

muestras de 30×30 cm con 10 cm de profundidad en cada una de las tres profundidades.

En cada muestra se recolectaron las lombrices y se obtuvo su peso vivo (biomasa). Las

unidades experimentales estaban arregladas en un diseño completamente aleatorizado

con tres repeticiones. La variable tratam_rep identifica a las unidades experimentales

sobre las que se miden las distintas profundidades y fue generada desde el menú Datos,

sub menú Cruzar categorias para formar una nueva variable (en la ventana de

selección de variables se declaró a tratam y rep como variables).

Para realizar el análisis de los datos del archivo Lombrices.IDB2, se deben declarar las

variables como se muestra a continuación (Figura 99).

Page 161: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

157

Figura 99: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo Lombrices.IDB2.

Luego, en la solapa Efectos fijos se deben declarar las variables como se muestra en la

siguiente figura (Figura 100).

Page 162: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

158

Figura 100: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo Lombrices.IDB2.

Por último, se declara en la solapa Correlación el modelo de Correlación espacial

exponencial, identificando a profund como coordenada X y a tratam_rep como criterio

de agrupamiento (Figura 101).

Page 163: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

159

Figura 101: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación espacial exponencial en los datos del archivo Lombrices.IDB2.

La salida correspondiente se presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,correlation=corExp(form=~as.numeric(as.character(Profund))|Tratam_Rep ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo000_Biomasa_REML Variable dependiente:Biomasa

Page 164: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

160

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 161.03 177.52 -66.52 3.46 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3725.04 <0.0001 Tratam 3 66.75 <0.0001 Profund 2 303.14 <0.0001 Tratam:Profund 6 4.86 0.0022 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(Profund)) | Tratam_Rep Metrica: euclidean Parámetros del modelo Parámetro Estim range 2.12

Todos los factores resultaron significativos, presentándose interacción entre

tratamientos y profundidad (p=0.0022). El parámetro range tiene un valor estimado de

2.12. Este parámetro debe interpretarse con cuidado, dependiendo del modelo de

correlación espacial usado. En la bibliografía geoestadística, el range se define, para

procesos espaciales estacionales de segundo orden, como la distancia a partir de la cual

las observaciones pueden considerarse independientes. El parámetro range que se

muestra en la salida está relacionado a esta definición, pero no es la distancia a partir de

la cual no hay más correlación (excepto en los modelos esférico y lineal). En los

modelos de correlación espacial, en los que la covarianza alcanza cero solo

asintóticamente (todos excepto el esférico y el lineal), no existe una distancia a la cual la

correlación espacial se haga 0, por lo que se usa el concepto de practical range

(distancia a partir de la cual la covarianza espacial se reduce al 5%, o equivalentemente,

la distancia a la cual el semivariograma alcanza el 95% de su máximo). Esta distancia

depende del modelo usado: para correlación espacial exponencial es 3 veces el range

estimado, mientras que para correlación espacial Gaussiana es √3 veces el range

estimado (Littel et ál. 2006). Para la correlación racional cuadrática este factor es

aproximadamente 4.36.

Page 165: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

161

En este ejemplo se usó un modelo de correlación espacial exponencial. La profundidad

1 era entre 0 y 10 cm, la 2 entre 10 y 20 cm y la 3 entre 20 y 30 cm, es decir, la

diferencia entre la profundidad 1 y 2 de la forma en que fueron declaradas, es de 1, sin

embargo en la escala original esta diferencia es de 10. Por lo tanto, el practical range en

la escala original es de 3×21.2 cm=63.6 cm. Esto implica que, para las profundidades

estudiadas (0 a 30 cm), las observaciones de biomasa de lombrices nunca serán

independientes (para que pudieran considerarse prácticamente independientes las

observaciones deberían estar a más de 63.6 cm, lo que es imposible con estos datos).

El modelo de correlación espacial exponencial isotrópico presentado aquí es equivalente

a un modelo autorregresivo de orden 1 (Casanoves et ál. 2005). Si con este mismo

conjunto de datos usamos ahora un modelo Autorregresivo de orden 1 (Figura 102) se

obtiene la siguiente salida.

Figura 102: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2.

Page 166: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

162

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo001_Biomasa_REML Variable dependiente:Biomasa Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 161.03 177.52 -66.52 3.46 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3725.05 <0.0001 Tratam 3 66.75 <0.0001 Profund 2 303.14 <0.0001 Tratam:Profund 6 4.86 0.0022 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep Parámetros del modelo Parámetro Estim Phi 0.62

La única diferencia entre esta salida y la anterior es que en ésta se muestra el parámetro

Phi de correlación (0.62) en vez del parámetro range.

A continuación estudiaremos la validez de los supuestos de este modelo. Para esto, en el

submenú Análisis-exploración de los modelos estimados se solicitaron los gráficos de

diagnóstico que se presentan a continuación (Figura 103).

Page 167: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

163

sol sombraL1 sombraNL

-1.5

-0.5

0.5

1.5

Tratam

Res

.con

d.es

tand

.Pea

rson

1 2 3

-1.5

-0.5

0.5

1.5

Profund

Res

.con

d.es

tand

.Pea

rson

30 40 50 60 70 80

-1.5

-0.5

0.5

1.5

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-2 -1 0 1 2

-1.5

-0.5

0.5

1.5

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s

Figura 103: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Lombrices.IDB2.

Como se puede observar la variabilidad de los residuos bajo los distintos tratamientos

parece diferente. Para evaluar un modelo heteroscedástico por tratamientos, en la solapa

Heteroscedasticidad se declararon las variables como en la (Figura 104) y se obtuvo la

siguiente salida.

Page 168: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

164

Figura 104: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del archivo Lombrices.IDB2.

Modelos lineales generales y mixtos Especificación del modelo en R modelo002_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,weight=varComb(varIdent(form=~1|Tratam)) ,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo002_Biomasa_REML Variable dependiente:Biomasa

Page 169: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

165

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 164.03 184.06 -65.02 4.20 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 4300.37 <0.0001 Tratam 3 54.19 <0.0001 Profund 2 511.72 <0.0001 Tratam:Profund 6 6.32 0.0004 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep Parámetros del modelo Parámetro Estim Phi 0.73 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Tratam Parámetros de la función de varianza Parámetro Estim sol 1.00 sombraL1 0.65 sombraL2 0.66 sombraNL 1.22

Los criterios AIC y BIC son mayores en el modelo heteroscedástico que en el

homoscedástico, indicando que este último es el mejor. Similar conclusión se obtiene a

partir de la prueba del cociente de verosimilitud (p=0.3916) al pedir la comparación de

los modelos como se mostró en la sección Análisis de un modelo ajustado.

Comparación de modelos df AIC BIC logLik Test L.Ratio p-value modelo001_Biomasa_REML 14 161.03 177.52 -66.52

modelo002_Biomasa_REML 17 164.03 184.06 -65.02 1 vs 2 3.00 0.3916

Por este motivo, nos quedamos con el modelo homoscedástico y, debido a la presencia

de interacción entre los dos factores, se realiza un diagrama de puntos para visualizar el

comportamiento de las medias de biomasa de lombrices (Figura 105).

Page 170: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

166

Sol SombraL1 SombraL2 SombraNL

1 2 3

Profundidad

20

30

40

50

60

70

80

90

Bio

ma

sa

Sol SombraL1 SombraL2 SombraNL

Figura 105: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su efecto sobre la biomasa. Datos archivo Lombrices.IDB2.

Como se puede observar, este gráfico sugiere la presencia de un comportamiento lineal

para sol y uno cuadrático para los otros tratamientos. Para probar estas hipótesis se

realizan contrastes ortogonales polinómicos a partir de la solapa Comparaciones,

subsolapa Contrastes (Figura 106).

Page 171: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

167

Figura 106: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo mixto con los datos del archivo Lombrices.IDB2.

A continuación se muestran los resultados de los contrastes. Se puede ver que el único

tratamiento que presenta solo tendencia lineal y no cuadrática es el de sol (p<0.0001 y

p=0.8147 respectivamente). El resto de los tratamientos, además de la tendencia lineal,

presentan una tendencia cuadrática.

Pruebas de hipótesis para contrastes Tratam*Profund F gl(num) gl(den) p-valor Cont.1 111.81 1 24 <0.0001 Cont.2 0.06 1 24 0.8147 Cont.3 222.11 1 24 <0.0001 Cont.4 26.66 1 24 <0.0001 Cont.5 164.40 1 24 <0.0001 Cont.6 10.52 1 24 0.0035 Cont.7 92.62 1 24 <0.0001 Cont.8 7.26 1 24 0.0127 Total 79.43 8 24 <0.0001

Page 172: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

168

Coeficientes de los contrastes Tratam Profund Cont.1 Cont.2 Cont.3 Cont.4 Cont.5 Cont.6 Cont.7 Cont.8 sol 1 -1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 sol 2 0.00 -2.00 0.00 0.00 0.00 0.00 0.00 0.00 sol 3 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 sombraL1 1 0.00 0.00 -1.00 1.00 0.00 0.00 0.00 0.00 sombraL1 2 0.00 0.00 0.00 -2.00 0.00 0.00 0.00 0.00 sombraL1 3 0.00 0.00 1.00 1.00 0.00 0.00 0.00 0.00 sombraL2 1 0.00 0.00 0.00 0.00 -1.00 1.00 0.00 0.00 sombraL2 2 0.00 0.00 0.00 0.00 0.00 -2.00 0.00 0.00 sombraL2 3 0.00 0.00 0.00 0.00 1.00 1.00 0.00 0.00 sombraNL 1 0.00 0.00 0.00 0.00 0.00 0.00 -1.00 1.00 sombraNL 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 -2.00 sombraNL 3 0.00 0.00 0.00 0.00 0.00 0.00 1.00 1.00

Page 173: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

169

Diseños de testigos apareados

Este tipo de arreglo de tratamientos es común en la evaluación de nuevos cultivares

(variedades, híbridos, etc.) en mejoramiento genético vegetal. Básicamente consisten en

ubicar en forma aleatoria el conjunto de cultivares a evaluar intercalando siempre entre

ellos un testigo común. La presencia de este testigo es la que permite de alguna forma

modelar los efectos sistemáticos de la calidad del terreno donde se ubican las parcelas

experimentales. Para ejemplificar su análisis se presenta un ejemplo con 16 híbridos

(H1,…, H16) y un testigo, y así se tiene un total de 32 unidades experimentales. Los

datos se encuentran en el archivo Testigos apareados.IDB2.

Una alternativa básica y muy poco eficiente para analizar estos datos es realizar un

ANOVA a una vía de clasificación, y comparar los tratamientos usando una estimación

del término de error a partir de la varianza entre los testigos (únicos niveles del factor

tratamiento que están repetidos). Este modelo es incapaz de contemplar los sesgos

producidos por las diferencias sistemáticas entre unidades experimentales. Para obtener

este modelo, se declara en el selector de variables a Rendimiento como variable

dependiente y a Hibrido como variable de clasificación.

En la solapa de Efectos fijos se declara al Hibrido como en la Figura 107. Luego, en la

solapa Comparaciones se solicitó la prueba LSD de Fisher para Hibrido.

Page 174: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

170

Figura 107: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2.

La salida correspondiente se presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Rendimiento_REML<-gls(Rendimiento~1+Hibrido ,method="REML" ,na.action=na.omit ,data=R.data21) Resultados para el modelo: modelo000_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 219.90 232.64 -91.95 101.35 0.69 AIC y BIC menores implica mejor

Page 175: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

171

Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3580.56 <0.0001 Hibrido 16 2.12 0.0763 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H4 1230.00 101.35 A H3 1222.00 101.35 A H14 1193.00 101.35 A B H10 1168.00 101.35 A B C H11 1116.00 101.35 A B C Testigo 1115.81 25.34 A B C H5 1099.00 101.35 A B C H9 1063.00 101.35 A B C H2 1037.00 101.35 A B C D H12 1033.00 101.35 A B C D H8 975.00 101.35 A B C D H7 966.00 101.35 A B C D H16 928.00 101.35 A B C D H6 907.00 101.35 B C D H1 886.00 101.35 C D H13 876.00 101.35 C D H15 756.00 101.35 D Letras distintas indican diferencias significativas(p<= 0.05)

La prueba F para Hibrido no resultó significativa (p = 0.0763) por lo cual no deben

interpretarse las diferencias de medias presentadas en la prueba LSD de Fisher.

La alternativa a este modelo es el uso de correlaciones espaciales para corregir las

medias de cada híbrido por el “efecto del sitio” en donde fueron ubicadas por azar. Para

esto, se procede a colocar la Posicion de la parcela como una covariable.

En la solapa Efectos fijos se deja igual que en la Figura 107. En la solapa Correlación se

especifican los diferentes modelos:

Modelo 1: Correlación espacial exponencial ( Figura 108).

Modelo 2: Correlación espacial Gaussiana (Figura 109).

Modelo 3: Correlación espacial lineal (Figura 110).

Modelo 4: Correlación espacial “rational quadratic” (Figura 111).

Modelo 5: Correlación espacial esférica (Figura 112).

Page 176: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

172

A continuación se muestran las ventanas de selección de correlación espacial y las

medidas de ajuste de cada uno de los modelos estimados.

Figura 108: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial exponencial.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 218.62 232.08 -90.31 112.79 0.58 AIC y BIC menores implica mejor

Page 177: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

173

Figura 109: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial Gaussiana.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 219.17 232.62 -90.58 106.78 0.58 AIC y BIC menores implica mejor

Page 178: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

174

Figura 110: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial lineal.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 219.13 232.58 -90.56 107.52 0.56 AIC y BIC menores implica mejor

Page 179: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

175

Figura 111: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial “rational quadratic”.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 218.81 232.26 -90.40 106.92 0.59 AIC y BIC menores implica mejor

Page 180: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

176

Figura 112: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial esférica.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 219.21 232.66 -90.60 137.39 0.56 AIC y BIC menores implica mejor

Todos los modelos ajustan bien, ya que sus valores de AIC y BIC son muy parecidos. El

modelo con menores valores es el de Correlación espacial exponencial (AIC=218.62,

BIC=232.08). La salida correspondiente a este modelo se presenta a continuación.

Page 181: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

177

Modelos lineales generales y mixtos Especificación del modelo en R modelo028_Rendimiento_REML<-gls(Rendimiento~1+Hibrido ,correlation=corExp(form=~as.numeric(as.character(Posicion)) ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data28) Resultados para el modelo: modelo028_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 218.62 232.08 -90.31 112.79 0.58 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 582.79 <0.0001 Hibrido 16 5.27 0.0012 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(Posicion)) Metrica: euclidean Parámetros del modelo Parámetro Estim range 2.74 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H3 1248.31 85.33 A H4 1244.19 85.33 A H10 1145.64 85.33 A B H5 1128.65 85.33 A B C Testigo 1096.98 45.09 A B C H2 1091.07 85.33 A B C H11 1078.43 85.33 A B C H9 1078.28 85.33 A B C H14 1070.07 85.33 A B C H1 1005.46 85.33 B C H12 979.80 85.33 B C H6 966.31 85.33 B C

Page 182: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

178

H7 936.21 85.33 B C D H8 933.40 85.33 B C D H16 902.87 85.33 C D H13 727.55 85.33 D E H15 653.36 85.33 E Letras distintas indican diferencias significativas(p<= 0.05)

Se encontraron diferencias entre híbridos (p = 0.0012). Mediante la prueba LSD de

Fisher de comparación de medias se pudo determinar que los híbridos de mayor

rendimiento fueron los H2, H3, H4, H5, H9, H10, H11, H14, y que éstos a su vez no

difieren del testigo.

Otra alternativa es pensar el problema como en los orígenes de la modelación espacial

(Papadakis 1937), y utilizar un análisis de covarianza para ajustar las medias de los

híbridos en las distintas posiciones. Para realizar una aproximación a este tipo de

análisis se construyó una nueva variable llamada Tes, la cual contiene los rendimientos

correspondientes a los testigos, luego se adicionó una nueva columna (Hib) en la que se

copiaron los valores del rendimiento del hibrido más cercano a cada testigo. Se calculó

luego la diferencia del rendimiento del testigo frente al hibrido (Dif).

A continuación se realizó un análisis de regresión lineal considerando a Dif como

variable dependiente y a Posicion como variable regresora. Se guardaron los predichos

de este modelo con el fin de utilizarlos como una covariable en el análisis de las medias

de híbridos.

Luego, en la ventana del selector de variables de Modelos lineales generalizados y

mixtos se declaran las variables como se muestra en la Figura 113.

Page 183: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

179

Figura 113: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Testigos_apareados.IDB2.

En la ventana de Efectos fijos se declara a Hibrido y a PRED_Dif. En la solapa

Comparaciones se solicitó la prueba LSD de Fisher. La salida correspondiente se

presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo029_Rendimiento_REML<-gls(Rendimiento~1+Hibrido+PRED_Dif ,method="REML" ,na.action=na.omit ,data=R.data29) Resultados para el modelo: modelo029_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 215.09 227.23 -88.54 79.89 0.82 AIC y BIC menores implica mejor

Page 184: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

180

Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 5763.58 <0.0001 Hibrido 16 3.42 0.0129 PRED_Dif 1 10.15 0.0066 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H4 1295.07 82.46 A H3 1293.92 83.02 A H10 1150.88 80.07 A B H5 1143.52 81.10 A B H2 1129.47 85.00 A B H14 1121.08 83.02 A B Testigo 1115.81 19.97 A B H11 1078.33 80.76 A B H9 1052.73 79.95 A B C H12 988.48 81.10 B C H1 985.32 85.76 B C H8 985.27 79.95 B C H7 983.12 80.07 B C H6 944.67 80.76 B C H16 828.68 85.76 C D H13 810.93 82.46 C D H15 663.53 85.00 D Letras distintas indican diferencias significativas(p<= 0.05)

Si bien se llega a la misma conclusión con respecto a los cultivares que en el análisis

usando correlación espacial exponencial, podemos observar que las medias ajustadas y

los errores estándares son diferentes. También difiere el orden o ranking presente entre

los híbridos que presentan los mayores rendimientos.

Por último, el contemplar la correlación espacial es una alternativa mucho más sencilla

para realizar este tipo de análisis.

Page 185: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

181

Referencias

Benjamini Y., Hochberg Y.1995. Controlling the false discovery rate: a practical and

powerful approach to multiple testing. J. R. Stat. Soc. Ser. B, 57:289-300.

Benjamini Y., Yekutieli, D. 2001. The control of the false discovery rate in multiple

hypothesis testing under dependency. The Annals of Statistics, 29(4):1165-

1188.

Besag J.E. 1974. Spatial interaction and the statistical analysis of lattice systems. J. R.

Stat. Soc. Ser. B 36: 192-225.

Besag J.E. 1977. Errors-in-variables estimation for Gaussian lattice schemes. J. R. Stat.

Soc. Ser. B 39: 73-78.

Casanoves F., Macchiavelli R., Balzarini, M. 2005. Error variation in multienvironment

peanut trials: Within-trial spatial correlation and between-trial heterogeneity.

Crop Science, 45: 1927-1933.

Casanoves F., Macchiavelli R., Balzarini M. 2007. Models for multi-environment yield

trials with fixed and random block effects and homogeneous and

heterogeneous residual variances. Journal of Agriculture of the University of

Puerto Rico, 91(3-4): 117-131.

Cullis B.R., Gogel B.J., Verbyla A.P., Thompson R. 1998. Spatial analysis of multi-

environment early generation trials. Biometrics 54: 1-18.

Di Rienzo J.A., Guzman A.W., Casanoves F. (2002). A Multiple Comparisons Method

based On the Distribution of the Root Node Distance of a Binary Tree

Obtained by Average Linkage of the Matrix of Euclidean Distances between

Treatment Means. JABES 7(2), 129-142.

Di Rienzo J. 2007.Curso de Diseño de Experimentos 2007 de la Maestría en Estadística

Aplicada – UNC. http://vaca.agro.uncor.edu/~estad/cursosposgrado.htm

Gilmour A.R., Thompson R, Cullis B.R., Verbyla A.P. 1997. Accounting for natural

and extraneous variation in the analysis of field experiments. J. Agric. Biol.

Env. Stat. 2: 269:273.

Hsu J.C. 1996. Multiple comparisons: Theory and methods. Firts edition. Chapman &

Hall, London. 277 p.

Page 186: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

182

Littel R., Milliken G., Stroup W., Wolfinger R., Schabenberger O. 2006. SAS for

Mixed Models. Second Ed., SAS Institute, Cary, NC.

Littel R., Pendergast J., Natarajan R. 2002. Modelling Covariance Structure in the

Analysis of Repeated Measures Data. Statistics in Medicine 19:1793-1819.

Martínez N. 2006. Determinación de la tasa de degradación de hojarasca de guadua

(Guadua angustifolia) e higuerón (Ficus glabrata) con y sin presencia de

macroinvertebrados acuáticos en una quebrada del Valle del Cauca, Colombia.

Disertación, Departamento de Biología, Universidad del Valle, Colombia.

Mead R. 1971. Models for interplant competition in irregularly spaced population. In:

Statistical Ecology, Patil G.P., Pielou E.C. and Waters W.E. (Eds.).

Pensilvania State University Press, College Town, Pa, pp: 13-22.

Milliken G.A., Johnson D.E. 1984. Analysis of Messy Data, Vol. 1. Van Nostrand

Reinhold, NY.

Moser E.B., Macchiavelli R. 2002. Model selection techniques for repeated measures

covariance structures. Proceedings of the XIV Conference on Applied

Statistics in Agriculture 14: 17-31.

Navarro C., Cavers S., Pappinen A., Tigerstedt P., Lowe A., Merila J. 2005. Contrasting

quantitative traits and neutral genetic markers for genetic resource assessment

of Mesoamerican Cedrela odorata. Silvae Genetica. 54: 281–292.

Papadakis J.S. 1937. Methode statistique pour des experiencessur champ. Institut

d’Amelioration des Plantes a Thessaloniki.

Pinheiro J.C., Bates D.M. 2004. Mixed-Effects Models in S and S-PLUS. Springer,

New York.

Pierson R.A., Ginther O.J. 1987. Follicular population dynamics during the estrus cycle

of the mare. Animal Reproduction Science 14: 219–231.

Ripley B.D. 1981. Spatial Statistics. Wiley, New York.

Zimmerman D.L., Harville D.A. 1991. A random field approach to the analysis of field

plot experiments and other spatial experiments. Biometrics 47: 223-239.

Page 187: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

183

Índice de cuadros

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2.........................................31 

Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................103 

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo

ECRmani.IDB2 ..........................................................................................................................................................141 

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo

ECRmani.IDB2 ..........................................................................................................................................................141 

Índice de figuras

Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto........................................2 

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2. ............................4 

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.......................6 

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2. .........................8 

Figura 5: Ventana de diálogo para importar datos desde las librerías de R...................................................................10 

Figura 6: Encabezamiento de la tabla de datos del archivo Ovary................................................................................11 

Figura 7: Relación entre el número de folículos (follicles) y el tiempo (Time). ...........................................................11 

Figura 8: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary. .......................................12 

Figura 9: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary................................13 

Figura 10: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary. ......................................15 

Figura 11: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para cada yegua

originada por el efecto aleatorio sobre la constante (archivo Ovary)............................................................................17 

Figura 12: Funciones ajustadas para el número de folículos para cada yegua originada por la inclusión de efectos

aleatorios sobre todos los parámetros de la parte fija del modelo (archivo Ovary).......................................................18 

Figura 13: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary. .........................19 

Figura 14: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada (archivo

Atriplex.IDB2)..............................................................................................................................................................22 

Figura 15: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales desplegada

(archivo Atriplex.IDB2). ..............................................................................................................................................23 

Figura 16: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) excluyendo la

modelación de la autocorrelación serial........................................................................................................................24 

Page 188: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

184

Figura 17: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) incluyendo la

modelación de la autocorrelación serial........................................................................................................................25 

Figura 18: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo

Compvar.IDB2. ............................................................................................................................................................28 

Figura 19: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la

especificación del Modelo 1. ........................................................................................................................................29 

Figura 20: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo

1 con los datos del archivo Compvar.IDB2. .................................................................................................................32 

Figura 21: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del archivo

Compvar.IDB2. ............................................................................................................................................................32 

Figura 22: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la

especificación de varianzas heterogéneas para poblaciones. ........................................................................................33 

Figura 23: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas residuales

heterogéneas para poblaciones y los datos del archivo Compvar.IDB2........................................................................38 

Figura 24: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la

especificación del Modelo 2. ........................................................................................................................................39 

Figura 25: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la

especificación del Modelo 2. ........................................................................................................................................39 

Figura 26: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la

especificación del Modelo 2. ........................................................................................................................................40 

Figura 27: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo

2 con los datos del archivo Compvar.IDB2. .................................................................................................................44 

Figura 28: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo

Compvar.IDB2 .............................................................................................................................................................45 

Figura 29: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del archivo

Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población. ......................................48 

Figura 30: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2. ............51 

Figura 31: Encabezamiento de la tabla de datos del archivo Trigo.IDB2. ....................................................................52 

Figura 32: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo

Trigo.IDB2. ..................................................................................................................................................................52 

Figura 33: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2..............................53 

Figura 34: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y

agua como criterios de estratificación...........................................................................................................................54 

Figura 35: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada para los datos

del archivo Trigo.IDB2.................................................................................................................................................56 

Figura 36: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2..........................57 

Page 189: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

185

Figura 37: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con

selección de función varIdent con variedad como criterio de agrupamiento. ...............................................................58 

Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y selección de la

subsolapa Medias..........................................................................................................................................................59 

Figura 39: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2. ...............................................61 

Figura 40: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo

Cobertura de gotas.IDB2. .............................................................................................................................................62 

Figura 41: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2. .......62 

Figura 42: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2

con Parcela como criterio de estratificación. ................................................................................................................63 

Figura 43: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara. ..............64 

Figura 44: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2

con Cara como criterio de agrupamiento. .....................................................................................................................65 

Figura 45: Diagramas de puntos para estudiar la interacción entre Coad y Altura y entre Cara y Altura. ....................68 

Figura 46: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del

almidón.IDB2. ..............................................................................................................................................................69 

Figura 47: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2.............................................70 

Figura 48: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Calidad

del Almidón.IDB2. .......................................................................................................................................................70 

Figura 49: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidón.IDB2. ....71 

Figura 50: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2.

......................................................................................................................................................................................72 

Figura 51: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2

que contempla otra forma de especificar la parte aleatoria. ..........................................................................................74 

Figura 52: Relación entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2..............78 

Figura 53: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del ejemplo

Cobertura forrajes.IDB2. ..............................................................................................................................................80 

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2. ........81 

Figura 55: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de Errores independientes (Modelo 1). .........................................................................................................82 

Figura 56: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2

con selección de función varIdent con tiempo como criterio de agrupamiento (Modelo 2)..........................................83 

Figura 57: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de simetría compuesta para datos agrupados por parcela (Modelo 3). .........................................................84 

Figura 58: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de modelo Autorregresivo de orden 1 para datos agrupados por parcela y orden de las observaciones

indicado por la variable Tiempo (Modelo 5). ...............................................................................................................85 

Page 190: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

186

Figura 59: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2

con parcela como criterio de estratificación (Modelo 7)...............................................................................................87 

Figura 60: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de modelo Autorregresivo continuo de orden 1 para datos agrupados por parcela y orden de las

observaciones indicado por la variable Tiempo (Modelo 8). ........................................................................................88 

Figura 61: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de modelo Sin estructura para datos agrupados por parcela y orden de las observaciones indicado por la

variable Tiempo (Modelo 9). ........................................................................................................................................89 

Figura 62: Ventana del Calculador de probabilidades y cuantiles de InfoStat. .............................................................93 

Figura 63: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de la subsolapa Contrastes. ...........................................................................................................................94 

Figura 64: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2. .........................97 

Figura 65: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2. ..98 

Figura 66: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos del archivo

CapacidadRespiratoria.IDB2. .......................................................................................................................................99 

Figura 67: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los datos del

archivo CapacidadRespiratoria.IDB2. ........................................................................................................................100 

Figura 68: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................101 

Figura 69: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................102 

Figura 70: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................103 

Figura 71: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2........................................107 

Figura 72: Ventana de selector de variables con solapa Particiones activada para los datos del archivo

MedCapRes.IDB2.......................................................................................................................................................108 

Figura 73: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................109 

Figura 74: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo

CapacidadRespiratoria.IDB2. .....................................................................................................................................110 

Figura 75: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro

tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. .................................................................................113 

Figura 76: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes diferentes para el

logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen

del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. ..............................114 

Figura 77: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro

tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. .................................................................................115 

Page 191: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

187

Figura 78: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de la materia seca

residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes ordenadas y pendientes.

Archivo Descomposición.IDB2..................................................................................................................................116 

Figura 79: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el logaritmo de

la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen del material

vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. ..................................................116 

Figura 80: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el

logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos

dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo

Descomposición.IDB2................................................................................................................................................117 

Figura 81: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de orden 2 con

ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que

lo almacena. Archivo Descomposición.IDB2.............................................................................................................118 

Figura 82: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2 con ordenadas

y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que

lo almacena. Archivo Descomposición.IDB2.............................................................................................................118 

Figura 83: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas

y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente en función del tiempo y el

tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la

bolsa que lo almacena. Archivo Descomposición.IDB2.............................................................................................119 

Figura 84: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de orden 2 con

ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que

lo almacena. Archivo Descomposición.IDB2.............................................................................................................120 

Figura 85: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas

y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para

cada combinación de tiempo y tratamiento, para el logaritmo de la materia seca remanente en función del tiempo y el

tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la

bolsa que lo almacena. Archivo Descomposición.IDB2.............................................................................................120 

Figura 86: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la

salida de la ejecución de un script o de la visualización de un objeto, Objetos: la lista de los objetos residente en la

memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que envía R a la consola.....121 

Figura 87: Curvas de tasas de descomposición según especie y tramado de la bolsa de almacenamiento..................124 

Figura 88: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BF.

....................................................................................................................................................................................129 

Figura 89: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo

BA. .............................................................................................................................................................................129 

Page 192: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

188

Figura 90: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRmaní.IDB2 y el

Modelo BA. ................................................................................................................................................................130 

Figura 91: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del

archivo ECRmaní.IDB2 y los Modelos BFH y BAH. ................................................................................................131 

Figura 92: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e Y

respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y los Modelos Exp

y BFExp......................................................................................................................................................................132 

Figura 93: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la variable rendimiento.

....................................................................................................................................................................................146 

Figura 94: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques completos al azar,

con la aleatorización para un bloque particular de los factores cantidad de nitrógeno y cantidad de riego. Datos del

archivo StripPlot.IDB2. ..............................................................................................................................................148 

Figura 95: Ventana del procedimiento de Análisis de varianza con la solapa Modelo desplegada para los datos del

archivo StripPlot.IDB2. ..............................................................................................................................................149 

Figura 96: Diagramas de puntos para estudiar la interacción entre Riego y Nitrógeno y su efecto sobre el rendimiento.

Datos archivo StripPlot.IDB2. ....................................................................................................................................151 

Figura 97: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo

StripPlot.IDB2 . ..........................................................................................................................................................152 

Figura 98: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del

archivo StripPlot.IDB2 . .............................................................................................................................................153 

Figura 99: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo

Lombrices.IDB2. ........................................................................................................................................................157 

Figura 100: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo

Lombrices.IDB2. ........................................................................................................................................................158 

Figura 101: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación espacial

exponencial en los datos del archivo Lombrices.IDB2...............................................................................................159 

Figura 102: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación

autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2..........................................................................161 

Figura 103: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Lombrices.IDB2..............163 

Figura 104: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del

archivo Lombrices.IDB2. ...........................................................................................................................................164 

Figura 105: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su efecto sobre la

biomasa. Datos archivo Lombrices.IDB2. ..................................................................................................................166 

Figura 106: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo

mixto con los datos del archivo Lombrices.IDB2.......................................................................................................167 

Figura 107: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2. ..170 

Figura 108: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial exponencial. ..........................................................................................................172 

Page 193: Modelos Mixtos en InfoStat

Modelos Mixtos en InfoStat

189

Figura 109: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial Gaussiana..............................................................................................................173 

Figura 110: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial lineal. ....................................................................................................................174 

Figura 111: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial “rational quadratic”...............................................................................................175 

Figura 112: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial esférica..................................................................................................................176 

Figura 113: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo

Testigos_apareados.IDB2...........................................................................................................................................179