Modelos Lineales Mixtosacademic.uprm.edu/rmacchia/agro6005/TutorialModelosMixtosInfostat.pdf ·...

Modelos Lineales Mixtos

Aplicaciones en InfoStat

Julio A. Di Rienzo

Raúl Macchiavelli

Fernando Casanoves

Actualizado en febrero de 2012

Modelos Lineales Mixtos en InfoStat

Julio A. Di Rienzo es Profesor Asociado de Estadística y

Biometría de la Facultad de Ciencias Agropecuarias de la

Universidad Nacional de Córdoba, Argentina. Director del

grupo de desarrollo de InfoStat y responsable de la

implementación de la interfase con R que se presenta en

esta obra ([email protected]).

Raúl E. Macchiavelli es Catedrático de Biometría en el

Facultad de Ciencias Agrícolas, Universidad de Puerto

Rico - Mayagüez ([email protected])

Fernando Casanoves es el Jefe de la Unidad de

Bioestadística del Centro Agronómico Tropical de

Investigación y Enseñanza (CATIE). Anteriormente trabajó

en la Facultad de Ciencias Agropecuarias de la Universidad

Nacional de Córdoba, Argentina, donde participó del

desarrollo de InfoStat ([email protected]).

mailto:[email protected]�




Di Rienzo, Julio Alejandro

Modelos lineales mixtos : aplicaciones en InfoStat / Julio Alejandro Di Rienzo Raúl Edgardo Macchiavelli.; Fernando Casanoves - 1a. ed. - Córdoba : Grupo Infostat, 2011.

193 p. : il. ; 23x15 cm.

ISBN 978-987-27045-0-6

1. Estadísticas. 2. Aplicaciones Informaticas. I. Casanoves, Fernando II. Macchiavelli, Raúl Edgardo. III. Título.

CDD 310.4

Fecha de catalogación: 27/06/2011

AGRADECIMIENTOS

Los autores agradecen a las Estadísticas Yuri Marcela García Saavedra y Jhenny Liliana

Salgado Vásquez, de la Universidad del Tolima, Colombia, por la lectura crítica del

manuscrito, la reproducción de la ejemplificación de este manual y los aportes sobre

algunos detalles de la interfaz.


ii

INDICE DE CONTENIDOS

Introducción ................................................................................................................................ 1

Requerimientos ........................................................................................................................... 1

Invocación del procedimiento de modelos lineales generales y mixtos .................................. 1

Especificación de los efectos fijos ............................................................................................... 2

Especificación de los efectos aleatorios ..................................................................................... 4

Comparación de medias de tratamientos .................................................................................. 8

Especificación de la estructura de correlación y de varianza de los errores ....................... 13

Especificación de la estructura de correlación ........................................................................ 13

Especificación de la parte fija .......................................................................................................... 15 Especificación de la parte aleatoria ................................................................................................. 16 Especificación de la correlación de los errores ............................................................................... 17

Especificación de la estructura de varianzas de los errores .................................................... 25

Análisis de un modelo ajustado .............................................................................................. 28

Ejemplos de Aplicación de Modelos Lineales Generales y Mixtos ....................................... 33

Estimación de componentes de varianza ................................................................................ 34

Efectos aleatorios cruzados con interacción ........................................................................... 56

Aplicación de modelos mixtos para datos estratificados ........................................................ 60

Parcelas divididas ............................................................................................................................ 60 Parcelas divididas en un arreglo en bloques .................................................................................... 61 Parcelas divididas en un arreglo en diseño completamente aleatorizado ........................................ 71 Parcelas subdivididas (split-split plot) ............................................................................................. 79

Aplicación de modelos mixtos para mediciones repetidas en el tiempo ................................ 88

Datos longitudinales ......................................................................................................................... 88 Análisis de un ensayo de establecimiento de forrajeras ................................................................... 89 Análisis de un ensayo de drogas para asma ................................................................................... 108 Análisis de ensayo de descomposición ........................................................................................... 124

Uso de modelos mixtos para el control de la variabilidad espacial en ensayos agrícolas .... 138

Correlación espacial ...................................................................................................................... 138 Análisis de un ensayo comparativo de rendimientos en maní ........................................................ 139

Aplicaciones de modelos mixtos en otros diseños experimentales ...................................... 161

Diseño en franjas (strip-plot) ......................................................................................................... 161 Diseño experimental con dos factores y dependencia espacial ...................................................... 169 Diseños de testigos apareados ........................................................................................................ 182

Aplicaciones en regresión lineal ........................................................................................... 194

Regresión con coeficientes aleatorios ............................................................................................ 194 Regresion heteroscedástica ............................................................................................................ 198

Bloques incompletos y diseños relacionados ....................................................................... 212


iii

Diseños Alfa látices ........................................................................................................................ 212 Diseño fila-columna latinizado ....................................................................................................... 220 Diseño en látice cuadrado equilibrado .......................................................................................... 227

Referencias............................................................................................................................... 237

Índice de cuadros .................................................................................................................... 240

Índice de figuras ...................................................................................................................... 240


1

Introducción

InfoStat implementa una interfase amigable de la plataforma R para la estimación de

modelos lineales generales y mixtos a través de los procedimientos gls y lme de la

librería nlme. La bibliografía de referencia de esta implementación, así como alguno de

los ejemplos utilizados, corresponde a Pinheiro y Bates (2004). La interfaz con R fue

escrita en Delphi® y depende de R-DCOM, un servidor de R que permite correr R en

background. R-DCOM es debido a Thomas Baier y Erich Neuwirth. El R-DCOM es

accedido desde Delphi gracias a las rutinas desarrolladas por Dieter Menne.

Requerimientos

Para que InfoStat pueda tener acceso a R, debe estar instalado en su sistema el

componente DCOM y R. Para ello consulte la ayuda en línea (aquí) o utilice el enlace

que se encuenta en el menú. Aplicaciones de InfoStat.

Invocación del procedimiento de modelos lineales generales y mixtos

En el menú Estadísticas seleccionar el submenú Modelos lineales generales y mixtos,

allí encontrará dos opciones. La primera, con el rótulo Estimación, invoca la ventana de

diálogo que permite especificar la estructura del modelo. La segunda, rotulada Análisis

–exploración de modelos estimados, se activa cuando algún modelo ha sido estimado

previamente y contiene un conjunto de herramientas para el análisis diagnóstico.

https://docs.google.com/document/pub?id=1GR69sVIp1mM8w2Y-mPK9tHSgG-mqp-rCKhjLjsNBams�


2

Especificación de los efectos fijos

Comenzaremos indicando cómo ajustar un modelo de efectos fijos, utilizando el archivo

Atriplex.IDB2 del conjunto de datos de prueba de InfoStat. Una vez abierto este archivo

activar el menú Estadísticas, submenú Modelos lineales mixtos, opción Estimación. En

la ventana de selección de variables, los factores de clasificación, covariables y

variables dependientes pueden ser especificados como en un análisis de la varianza para

efectos fijos. Para los datos en el archivo Atriplex.IDB2 especificar PG como variable

respuesta y como criterios de clasificación a Tamaño y Episperma. Una vez que se

acepta la selección realizada se mostrará la ventana principal de la interfase para

modelos mixtos. Esta ventana contiene cinco solapas (Figura 1).

Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto.

La primera permite especificar los efectos fijos del modelo y seleccionar opciones para

la presentación de resultados y la generación de predicciones, obtener residuos del

modelo y especificar el método de estimación. Por defecto el método de estimación es

máxima verosimilitud restringida (REML).

A la derecha de la ventana aparecerá una lista conteniendo las variables de clasificación

y las covariables declaradas en la ventana de selección de variables. Para incluir un

factor (variable de clasificación) o una covariable a la parte fija del modelo, basta hacer

doble clic sobre el nombre del factor o covariable que se quiere incluir. Esta acción

agregará una línea en la lista de efectos fijos. Doble clics adicionales sobre un factor o

una covariable agregarán términos en líneas sucesivas, implícitamente separados por un

signo “+” (modelo aditivo). Seleccionando con el ratón los factores principales y

accionando el botón “*” se introduce un término que especifica la interacción entre los

factores. Para el conjunto de datos en el archivo Atriplex.IDB2, incluir en el modelo de

efectos fijos los factores Tamaño, Episperma y su interacción (Figura 2). Algunos de los

textos en estas ventanas han sido aumentados de tamaño para mejorar su visualización

(esto se logra moviendo el roller del ratón mientras la tecla Ctrl del teclado esta

apretada).

http://dl.dropbox.com/u/65302225/Datos/Atriplex.idb2�


3

Si aceptamos esta especificación, en la ventana de resultados de InfoStat se obtendrá la

salida que se muestra a continuación de la Figura 2. La salida que se obtiene es la más

sencilla ya que no se han especificado características adicionales del modelo u otras

opciones de análisis. La primera parte contiene la especificación de la forma en que se

invocó la estimación del modelo en la sintaxis de R, e indica el nombre del objeto R que

contiene al modelo y su estimación. En este caso modelo001_PG_REML. Esta

especificación es sólo de interés para aquellos que están acostumbrados a ver las

sentencias en R.

La segunda parte muestra medidas de ajuste que son útiles para comparar distintos

modelos ajustados a un conjunto de datos. AIC hace referencia al criterio de Akaike,

BIC al Criterio Bayesiano de Información, logLik al logaritmo de la verosimilitud y

Sigma a la desviación estándar residual.

La tercera parte de esta salida presenta una tabla de análisis de la varianza mostrando las

pruebas de hipótesis de tipo secuencial.

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2.


4

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_PG_REML<-gls(PG~1+Tamano+Episperma+Tamano:Episperma ,method="REML" ,na.action=na.omit ,data=R.data01) Resultados para el modelo: modelo001_PG_REML Variable dependiente:PG Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 27 160.36 169.26 -70.18 9.07 0.92 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1409.95 <0.0001 Tamano 2 10.49 0.0010 Episperma 2 90.53 <0.0001 Tamano:Episperma 4 2.29 0.0994

Especificación de los efectos aleatorios

Los efectos aleatorios están asociados a grupos de observaciones. Ejemplos típicos son

las medidas repetidas sobre un mismo individuo o las respuestas observadas en grupos

de unidades experimentales homogéneas (bloques) o en los individuos de un mismo

grupo familiar, etc. Estos efectos aleatorios son “agregados” a los efectos fijos de

manera selectiva. Por lo tanto, en la especificación de los efectos aleatorios es necesario

tener uno o más criterios de agrupamiento o estratificación, y elegir sobre qué efectos

fijos se agregan los efectos aleatorios asociados. En el procedimiento lme de R, sobre el

que se basa esta implementación, cuando hay más de un criterio de agrupamiento

admisible, el criterio por omisión es que estos son anidados o encajados. Sin embargo

existe la posibilidad de declarar términos aleatorios cruzados. En el módulo de Modelos

lineales generales y mixtos de InfoStat, solapa Efectos aleatorios, se usa el símbolo >

para declarar un factor anidado (A>B indica que B esta anidados en A); el símbolo + se

usa para declarar factores cruzados (A+B indica que A y B son factores cruzados); el

símbolo * se usa para declarar interacciones (A*B explicita la interacción entre A y B).

Estos símbolos pueden directamente escribirse en la ventana, o bien, pulsando el botón


5

derecho del ratón sobre dos o más factores, previamente seleccionados, aparece una

ventana con estas opciones.

En la segunda solapa del diálogo de especificación del modelo podemos elegir los

criterios de estratificación o agrupamiento y la forma en que éstos incorporan efectos

aleatorios a los componentes fijos. Para ejemplificar la especificación de los efectos

aleatorios consideremos el archivo de prueba Bloque.IDB2. Este archivo contiene tres

columnas: Bloque, Tratamiento y Rendimiento. En este ejemplo indicaremos que los

bloques fueron seleccionados en forma aleatoria o producen un efecto aleatorio (por

ejemplo, si los bloques son conjuntos de parcelas, el efecto de estos puede ser

considerado aleatorio ya que su respuesta dependerá entre otras cosas de condiciones

ambientales que no son predecibles), mientras que los tratamientos agregan efectos

fijos. Para especificar este modelo, las dos primeras columnas del archivo de pruebas

Bloque.IDB2 (Bloque y Tratamiento) se ingresarán como criterios de clasificación y la

última (Rendimiento) como variable dependiente. El factor Tratamiento se incluirá en la

solapa Efectos fijos como el único componente de esa parte del modelo. Para agregar el

efecto aleatorio de los bloques, seleccionaremos la solapa Efectos aleatorios. Cuando se

selecciona ésta solapa la lista Criterios de estratificación está vacía. Haciendo doble clic

sobre Bloque en la lista de variables, se agrega este factor de clasificación, como criterio

de agrupamiento. La inclusión de un criterio de estratificación activa, en el panel

inferior, un dispositivo que permite detallar la forma en que el efecto aleatorio entra en

el modelo. En éste dispositivo hay una lista de componentes de la parte fija de modelo.

El primer componente hace referencia a la Constante y el resto a los otros términos, en

este caso Tratamiento (Figura 3).

http://dl.dropbox.com/u/65302225/Datos/Bloque.idb2�


6

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.

Dentro de la lista de términos fijos aparecen los criterios de estratificación previamente

especificados. La combinación de ambas listas define los efectos aleatorios. Para ello,

cada criterio de estratificación, dentro de cada efecto fijo, tiene asociado un check box.

Cuando éste está tildado indica que hay un conjunto de efectos aleatorios asociados al

efecto fijo correspondiente. El número de efectos aleatorios es igual al número de

niveles que tiene el término fijo del modelo o a 1 en el caso de la constante o de las

covariables. En el ejemplo que se ilustra se está incluyendo un efecto aleatorio inducido

por los bloques sobre la constante.

Esta especificación representa al siguiente modelo:

; 1,.., ; 1,...,ij i j ijy b i T j Bµ τ ε= + + + = = (1)

donde ijy es la respuesta al i-ésimo tratamiento en el j-ésimo bloque, µ la media

general de rendimientos, iτ los efectos fijos de los tratamientos, jb el cambio del nivel

medio de ijy asociado al j-ésimo bloque y ijε el término de error asociado a la


7

observación ijy . T y B son el número de niveles del factor de clasificación

correspondiente al efecto fijo Tratamiento y al número de bloques respectivamente. Los

jb se consideran, a diferencia de un efecto fijo, como variables aleatorias idénticamente

distribuidas ( )20, bN σ y cuyas realizaciones se interpretan como los efectos de los

distintos grupos o estratos (bloques, en este ejemplo). Luego, en estos modelos, los jb

no se estiman, lo que se estima es el parámetro 2bσ que caracteriza a su distribución.

Los ijε también se interpretan como variables aleatorias idénticamente distribuidas

( )20,N εσ y describen a los errores aleatorios asociados a cada observación. Se supone,

además, que las variables aleatorias jb y ijε son independientes.

La salida del ejemplo se muestra a continuación. La parte nueva de esta salida, respecto

del ejemplo con el modelo lineal de efectos fijos, es que tiene una sección de parámetros

para los efectos aleatorios.

Especificación del modelo en R modelo002_Rendimiento_REML<-lme(Rendimiento~1+Tratamiento ,random=list(Bloque=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data03 ,keep.data=FALSE) Resultados para el modelo: modelo003_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 20 218.77 223.73 -102.39 160.65 0.89 0.93 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 12 2240.00 <0.0001 Tratamiento 4 12 41.57 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.57


8

En este caso se presenta la estimación de bσ (la desviación estándar de los jb relativa al

residual) como 0.57. Al comienzo de la salida puede observarse la estimación de εσ , la

desviación estándar de los ijε , como 160.65. Así, la varianza de los bloques puede

calcularse como: 2 2(0.57 160.65) 8385.15bσ = × =

Comparación de medias de tratamientos

Siguiendo en la solapa Comparaciones (Figura 4), si en el panel que lista los términos

fijos del modelo se tilda alguno de ellos, se obtiene una tabla de medias y errores

estándares y una comparación múltiple entre medias del tipo LSD de Fisher (esta prueba

está basada en una prueba de Wald) o la prueba de formación de grupos excluyentes

DGC (Di Rienzo et ál. 2002). También se presentan varias opciones de corrección por

comparaciones múltiples.

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2.


9

La salida correspondiente a la comparación de las medias de tratamientos se presenta a

continuación.

Medias ajustadas y errores estándares para Tratamiento LSD Fisher (alfa=0.05) Procedimiento de corrección de p-valores: No Tratamiento Medias E.E. 300 3237.75 92.47 A 225 3093.50 92.47 A B 150 2973.00 92.47 B 75 2498.50 92.47 C 0 1972.75 92.47 D Medias con una letra común no son significativamente diferentes(p<= 0.05)

La comparación de medias de tratamientos se muestra de la forma clásica como una

lista ordenada en forma decreciente.

Si el usuario desea controlar el error tipo I para la familia de todas las comparaciones de

a pares, puede optar por alguno de los cuatro criterios implementados: Bonferroni (Hsu

1996), Sidak (Hsu 1996), Benjamini-Hochberg (Benjamini y Hochberg 1995) o

Benjamini-Yekutieli (Benjamini y Yekutieli 2001). Si para este mismo conjunto de

datos se selecciona la opción Bonferroni, se obtiene el siguiente resultado:

Medias ajustadas y errores estándares para Tratamiento LSD Fisher (alfa=0.05) Procedimiento de corrección de p-valores: Bonferroni Tratamiento Medias E.E. 300 3237.75 92.47 A 225 3093.50 92.47 A B 150 2973.00 92.47 A B 75 2498.50 92.47 B 0 1972.75 92.47 B Medias con una letra común no son significativamente diferentes(p<= 0.05)

En el caso de que haya más de un efecto aleatorio, InfoStat permite especificar

estructuras complejas de anidamiento (jerarquización) y/o cruzamiento (con o sin

interacción). Supongamos que hay un factor fijo (A) y tres factores aleatorios (B, C, y

D). Para especificar los términos de efectos aleatorios anidados (la opción por defecto),

simplemente se listan los factores en orden jerárquico en la solapa de Efectos aleatorios

(Figura 5)


10

Figura 5: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se

incluyen como efectos aleatorios anidados.

Esta formulación es equivalente a escribir la siguiente sentencia (Figura 6).

Figura 6: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se

incluyen como efectos aleatorios anidados (forma explícita).

La incorporación de efectos cruzados sin interacción se realiza seleccionando todos los

factores a cruzar en la ventana de variables, y oprimiendo el ratón derecho para colocar

los efectos cruzados en la ventana de Criterios de estratificación (Figura 7)


11

Figura 7: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen

como efectos aleatorios cruzados.

La incorporación de efectos cruzados con interacción se realiza agregando a la

especificación anterior el(los) efecto(s) de interacción deseados (Figura 8)

Figura 8: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen

como efectos aleatorios cruzados con interacción.

Para combinar efectos aleatorios anidados y cruzados se pueden usar diferentes líneas

en la ventana Criterios de estratificación. Por ejemplo, para especificar un modelo con

C y D cruzados con interacción y el efecto B anidado en el efecto principal de C

especificamos como en la Figura 9.


12

Figura 9: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se

incluyen como efectos aleatorios cruzados con interacción y B esta anidado en C.

Para especificar los efectos de B y C ambos anidados dentro de A (recordemos que A es

fijo), escribimos en la ventana de Criterios de estratificación como en la Figura 10.

Figura 10: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B y C se

incluyen como efectos aleatorios cruzados, ambos anidados dentro del factor fijo A.

Para especificar el efecto de B y los efectos de D y C (todos aleatorios) ambos anidados

dentro de B (cruzados entre sí), escribimos en la ventana de Criterios de estratificación

como en la Figura 11.

Figura 11: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso C y D se incluyen

como efectos aleatorios cruzados, ambos anidados en el efecto aleatorio B.


13

En todos los casos en que se usan arreglos no anidados de efectos aleatorios, la única

estructura de la matriz de covarianza de estos efectos aleatorios disponible es la

estructura de independencia entre efectos aleatorios y varianzas iguales para

realizaciones distintas de un mismo efecto. Se pueden también especificar modelos de

regresión con coeficientes aleatorios, pero la sintaxis es diferente (ver ejemplo de

Aplicaciones en regresión lineal).

Especificación de la estructura de correlación y de varianza de los errores

Las estructuras de varianzas y de covarianzas pueden modelarse separadamente. Para

ello, InfoStat presenta dos solapas: en la solapa Correlación se encuentran las opciones

para especificar la estructura de correlación de los errores y la solapa

Heteroscedasticidad permite seleccionar distintos modelos para la función de varianza.

A continuación se describen los contenidos de estas solapas.

Especificación de la estructura de correlación

Para ejemplificar la utilización de esta herramienta recurriremos a un ejemplo citado en

Pinheiro y Bates (2004). Corresponde al archivo “Ovary” que contiene los datos de un

estudio de Pierson y Ginther (1987) sobre el número de folículos mayores de 10 mm en

ovarios de yeguas (mare). Estos números se registraron a los largo del tiempo desde 3

días antes de la ovulación y hasta 3 días después de la siguiente ovulación. Los datos

pueden cargarse desde la librería nlme utilizando el ítem de menú Aplicaciones>>Data

set de R. Cuando se activa esta opción aparece la siguiente ventana de diálogo, que

puede diferir en el número de librerías que estén instaladas en su configuración local de

R (Figura 12).


14

Figura 12: Ventana de diálogo para importar datos desde las librerías de R.

En ella se muestra tildada la librería nlme y a la derecha la lista de archivos de datos en

esa librería. Haciendo doble clic sobre “Ovary, nlme” se abrirá una tabla de datos de

InfoStat conteniendo los datos correspondientes. El encabezamiento de la tabla abierta

se muestra a continuación (Figura 13).

Figura 13: Encabezamiento de la tabla de datos del archivo Ovary.


15

Una gráfica de la relación entre número de folículos y el tiempo se muestra a

continuación (Figura 14).

Figura 14: Relación entre el número de folículos (follicles) y el tiempo (Time).

Pinheiro y Bates (2004) proponen ajustar un modelo donde el número de folículos

depende linealmente del seno(2*pi*Time) y el coseno(2*pi*Time). Este modelo trata de

reflejar las variaciones cíclicas del número de folículos mediante la inclusión de

funciones trigonométricas. Además proponen la inclusión de un efecto aleatorio de

yegua (Mare) sobre la constante del modelo y una auto-correlación de orden 1 de los

errores dentro de cada hembra. El efecto aleatorio se incluyó para romper con la falta de

independencia debida a efectos sujeto-dependientes que se expresan como perfiles

paralelos del número de folículos a través del tiempo. El modelo propuesto tendría la

siguiente forma general:

( ) ( )0 1 2 02* * 2* *it i ity sin pi Time cos pi Time bβ β β ε= + + + + (2)

donde los componentes aleatorios son ( )20 ~ 0,i bob N σ y ( )2~ 0,it Nε σ .

Por otra parte, la inclusión de una auto-correlación de orden 1 AR1 dentro de cada

yegua tiene como propósito modelar una eventual correlación serial. Para especificar

este modelo en InfoStat, indicaremos que follicles es la variable dependiente, que Mare

es un criterio de clasificación y que Time es una covariable.

Especificación de la parte fija

La parte fija del modelo quedará indicada como se muestra en la Figura 15. InfoStat

verifica que los elementos en esta ventana se corresponden con los factores y

covariables listados en la parte derecha de la ventana.

-0,25 0,00 0,25 0,50 0,75 1,00 1,25Time

0

5

10

15

20

25Fo

llicl

es


16

Figura 15: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary.

Si no es así, porque no se han respetado minúsculas y mayúsculas (R es sensible a la

tipografía), entonces InfoStat substituye eso términos por los apropiados. Pero si aún

así, hay palabras que InfoStat no puede interpretar (como en este caso sin, cos y pi),

entonces la línea queda marcada en rojo. Esto no quiere decir que esté incorrecta sino

que puede estarlo y advierte al usuario para que la verifique.

Especificación de la parte aleatoria

La parte aleatoria se indica agregando a la lista de criterios de estratificación el factor

Mare y especificando que el efecto yegua (Mare) es sobre la constante. Esto se indica

tildando Mare dentro de Constante como se muestra en la Figura 16 (este tildado se

agrega por defecto). Los términos sin(2*pi*Time) y cos(2*pi*Time) no presentan, en

este caso, efectos aleatorios asociados.


17

Figura 16: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary.

Especificación de la correlación de los errores

La especificación de la correlación autorregresiva de orden 1 para los errores dentro de

cada hembra, se indica en la solapa Correlación 1 Figura 17 como se ilustra en la . En R

hay dos grupos de modelos de correlación. El primero corresponde a modelos de

correlación serial, donde se supone que los datos están ordenados en una secuencia, y el

segundo grupo modela correlaciones espaciales. En el primer grupo encontramos los

modelos de simetría compuesta, sin estructura, autorregresivo de orden 1,

autorregresivo continuo de orden 1 y el modelo ARMA(p,q), donde p indica el número

de términos autorregresivos y q el número de términos de medias móviles (moving

average). Todos estos modelos suponen que los datos están ordenados en una

1 Si los errores se suponen independientes (no correlacionados), entonces debe seleccionarse la primera

opción de la lista de estructura de correlación (seleccionada por defecto).


18

secuencia. Por defecto, InfoStat asume la secuencia en la que los datos están dispuestos

en el archivo, pero si existe una variable que los ordena de manera diferente, ésta debe

indicarse en el casillero Variable que indica el orden de las observaciones (para que

este casillero se active hay que seleccionar alguna de las estructuras de correlación).

Esta variable debe ser entera para la opción autorregresiva. Por este motivo, InfoStat

agrega en la sentencia traducida al lenguaje R, una indicación para que la variable sea

interpretada como entera. En el ejemplo que estamos ilustrando, la variable Time es un

número real que codifica el tiempo relativo a un punto de referencia y está en una escala

inapropiada para usarla como criterio de ordenamiento. Sin embargo, como los datos

están ordenados por tiempo dentro de cada yegua (Mare), esta especificación puede

omitirse (Figura 17).

Figura 17: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary.

Si los datos no estuvieran ordenados en forma ascendente dentro del criterio de

agrupamiento (Mare), habría que agregar una variable que identifique el orden. Para


19

agregar una variable de ordenamiento su nombre puede escribirse o arrastrarse con el

ratón desde la lista de variables al casillero correspondiente. Es usual que la estructura

de correlación esté asociada a un criterio de agrupamiento, en este caso Mare. Esto se

indica en el panel rotulado Criterios de agrupamiento (para que este casillero se active

hay que seleccionar alguna de las estructuras de correlación). Si se incluye más de un

criterio, InfoStat construye tantos grupos como combinación de niveles en los factores

de clasificación que se especifiquen. En la parte inferior de la ventana, rotulada

Expresión resultante, se muestra la expresión R que se está especificando para la

componente “corr=” de gls o lme. Esta expresión es sólo informativa y no puede

editarse.

A continuación se presenta la salida completa del modelo ajustado conteniendo la tabla

de análisis de la varianza de los efectos fijos, que en este caso son pruebas secuenciales

sobre las pendientes asociadas a las covariables sin(2*pi*Time) y cos(2*pi*Time). Se

observa que la desviación estándar del componente aleatorio de la ordenada al origen es

0.77 veces la desviación estándar residual y que el parámetro phi del modelo

autorregresivo es 0.61.

Modelos lineales generales y mixtos Especificación del modelo en R Modelo000_follicles_REML<-lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time) ,random=list(Mare= pdIdent(~1)) ,correlation=corAR1(form=~1|Mare) ,method="REML" ,na.action=na.omit ,data=R.data2 ,keep.data=FALSE) Variable dependiente:follicles Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 308 1562.45 1584.77 -775.22 3.67 0.21 0.56 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 295 163,29 <0,0001 sin(2 * pi * Time) 1 295 34,39 <0,0001 cos(2 * pi * Time) 1 295 2,94 0,0877 Parámetros de los efectos aleatorios


20

Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Mare Desvíos estándares relativos al residual y correlaciones (Const) (Const) 0.77 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ 1 | Mare Parámetros del modelo Estimación Phi 0.61

Los valores predichos por el modelo ajustado anteriormente versus el tiempo se

presentan en la Figura 18. La línea de trazo negro representa la estimación del promedio

poblacional y corresponde a las estimaciones de la parte fija del modelo. Para obtener

las estimaciones para obtener la curva, el usuario debe solicitar en la solapa de efectos

fijos los predichos. Por defecto el nivel de los valores predichos es cero (indicado en el

campo de edición: Niveles) lo que indica que las predicciones están basadas solamente

en la parte fija del modelo.

Las curvas punteadas, paralelas a la curva promedio, son las predicciones para el perfil

de cada yegua derivadas de la inclusión de un efecto aleatorio (sujeto específico) sobre

la constante. Para obtener las predicciones para obtener estas curvas el usuario debe

solicitar también, en la solapa de efectos fijos, los valores predichos del nivel 1. Para

obtener ambas predicciones el usuario deber escribir en el campo de edición de Niveles

la expresión: 0;1.

Para probar la adecuación del modelo identificamos los puntos correspondientes a cada

yegua y dibujamos una curva suavizada para cada una ellas como se muestra en la

Figura 19. Comparando la Figura 18 y la Figura 19 se observa que cada yegua tiene un

perfil diferente que esta sobresimplificado por el modelo representado en la Figura 18.

¿Cómo incluiríamos en el modelo la variabilidad sujeto específica observada en la

Figura 19? La forma más simple de incluir este comportamiento sujeto-específico es

agregar más efectos aleatorios al modelo de la ecuación (2). Como resultado tenemos el

siguiente modelo:


21

( ) ( )( ) ( )

0 1 2

0 1 2

sin 2* * cos 2* *

sin 2* * cos 2* *it

i i i it

y pi Time pi Time

b b pi Time b pi Time

β β β

ε

= + +

+ + + + (3)

donde los components aleatorios son ( )20 ~ 0,i bob N σ , ( )2

1 1~ 0,i bb N σ , ( )22 2~ 0,i bb N σ

and ( )2~ 0,it Nε σ y, como una primera aproximación los supondremos mutuamente

independientes.

Para ajustar el modelo (3) debemos hacer algunos cambios en el conjunto de datos

debido a algunas restricciones en el uso de formula en la solapa de los efectos

aleatorios. Por lo tanto calculamos ( )sin sin 2* *T pi Time= y

( )2cos cos 2* *T pi Timeβ= como nuevas variable en el conjunto de datos.

En la parte fija del modelo en vez de especificar una lista de variable especificaremos en

una línea única 1 sin cosT T+ + como se muestra en la Figura 20. Esta manera de

especificar la parte fija no afecta las estimaciones de los efectos fijos pero nos permite

introducir fácilmente los efectos aleatorios 0 1,i ib b y 2ib . Luego, en la solapa de efectos

aleatorios especificamos los efectos aleatorios como se muestra en la Figura 21. Notar

que la estructura de covariación supuesta para los efectos aleatorios ha sido especificada

como pdDiag, lo que indica que las varianzas de cada componente aleatorios son

diferentes y que estas componentes no están correlados. Los resultados del ajuste de este

modelo se muestran en la Figura 22. En esta figura se puede observar que el efecto de

ajustar curvas sujeto-específicas para cada yegua, lo que permite una representación

más realista de los ciclos individuales. A pesar de esto, desde un punto de vista

estadístico no es apropiado suponer independencia entre efectos aleatorios de los

parámetros de un modelo de regresión. Para especificar correlación entre efectos

aleatorios indicamos la estructura de covarianza como pdSymm. Esto se muestra en la

Figura 23 y el resultado del ajuste se muestra en la Figura 24.


22

Figura 18: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para cada yegua originada por el efecto aleatorio sobre la constante (archivo Ovary).

Figura 19: Valores suavizados (polinómico de tercer grado) para el número de folículos (lineas sólidas) para cada yegua (Archivo Ovary).

Poblacional Mare 01 Mare 02Mare 03 Mare 04 Mare 05Mare 06 Mare 07 Mare 08Mare 09 Mare 10 Mare 11

-0,30 0,10 0,50 0,90 1,30Time

2

7

12

17

22

folli

cles

Poblacional Mare 01 Mare 02Mare 03 Mare 04 Mare 05Mare 06 Mare 07 Mare 08Mare 09 Mare 10 Mare 11

-0.25 0.00 0.25 0.50 0.75 1.00 1.25Time

0

5

10

15

20

25

Folli

cles


23

Figura 20: Especificación de la parte fija del modelo (3)

Figura 21: Especificación de la parte aleatoria del modelo (3).


24

Figura 22: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos

aleatorios: pdSymm.

Figura 23: Especificación de la parte aleatoria del modelo (3) pero permitiendo que éstos varien en varianza y estén correlacionados.

-0,30 0,10 0,50 0,90 1,30Time

2

6

10

14

18

22

folli

cles


25

Figura 24: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos

aleatorios: pdSymm.

Especificación de la estructura de varianzas de los errores

Este módulo permite contemplar modelos heteroscedásticos. La heteroscedasticidad sin

embargo no tiene un origen único y así como se modela la correlación entre los errores,

la heteroscedasticidad también puede modelarse. El modelo para las varianzas de los

errores se puede especificar de la siguiente manera: 2 2var( ) ( , , )i i igε σ µ= zδ donde

(.)g se conoce como función de varianza. Esta función puede depender de la esperanza

( )iµ de iY (la variable de respuesta), de un conjunto de covariables ( )iz y de un vector

de parámetros ( )δ . InfoStat, a través de R, estima los parámetros ( )δ de acuerdo a la

función de varianza seleccionada. La solapa Heteroscedasticidad se muestra en la

Figura 25. Las funciones de varianza admitidas pueden ser identidad (varIdent),

exponencial (varExp), potencia (varPower), potencia corrida por una constante

(varConstPower), o fija (varFixed). R admite que varios modelos de varianza puedan

superponerse, es decir, que para ciertos grupos de datos la varianza puede estar asociada

con alguna covariable y para otros con otra. La especificación simultánea de varios

modelos para la función de varianza se obtiene, simplemente, marcando y especificando

cada uno de los componentes y agregándolos a la listas de funciones de varianza.

InfoStat arma la sentencia apropiada para R.

Mare 1 Mare 2 Mare 3 Mare 4 Mare 5 Mare 6Mare 7 Mare 8 Mare 9 Mare 10 Mare 11

-0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2Time

4

6

8

10

12

14

16

18

20

22

PRED

_1_f

ollic

les

Mare 1 Mare 2 Mare 3 Mare 4 Mare 5 Mare 6Mare 7 Mare 8 Mare 9 Mare 10 Mare 11


26

En la solapa Heteroscedasticidad para el ejemplo de los folículos, hemos indicado que

la varianza de los errores es distinta para cada yegua, seleccionando varIdent como

modelo de la función de varianza y escribiendo Mare en Criterios de agrupamiento.

Figura 25: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary.

A continuación se presenta la salida del ajuste incluyendo estimaciones de la desviación

estándar del error para cada yegua. También aquí las desviaciones estándar están

expresadas en términos relativos a la desviación estándar residual. Además, el primer

nivel del criterio de agrupamiento especificado para calcular estas desviaciones estándar

diferenciales, es siempre inicializado en 1 porque de otra forma el modelo no es

identificable. En la salida se observa que la hembra 5 tiene una variabilidad en el

número de folículos comparativamente mayor que las otras hembras.

El modelo considerado en la Ecuación (4) con varianzas residuales para estos datos

heterogéneas es:


27

( ) ( )0 1 2 02* * 2* *it i ity sin pi Time cos pi Time bβ β β ε= + + + + (5)

donde los componentes aleatorios son ( )20 ~ 0,i bob N σ y ( )2~ 0,it iNε σ .

Obsérvese que la varianza residual está sub-indicada con el índice que identifica a las

yeguas.

Como es usual, los componentes aleatorios del modelo se suponen independientes.

Luego si tomamos una yegua al azar la varianza de la respuesta sería la suma de las

varianzas de la parte aleatoria, es decir 2 20var( )it b iy σ σ= + , o sea (3.57*0.8)2 +

(3.57*gi)2, donde gi es la función de varianza para una yegua elegida aleatoriamente.

Ahora bien, cuando se condiciona a una yegua dada (por ejemplo la 5), el efecto

individuo ( 0ib ) está fijado, así que la varianza de la yegua 5 solo está asociada a la parte

residual y además la función de varianza queda especificada, (es decir, hay que usar g5)

y la varianza sería (3.57*1.34)2.

Modelos lineales generales y mixtos Especificación del modelo en R Modelo001_follicles_REML<-lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time) ,random=list(Mare= pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Mare)) ,correlation=corAR1(form=~1|Mare) ,method="REML" ,na.action=na.omit ,data=R.data5 ,keep.data=FALSE) Variable dependiente:follicles Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 308 1569.02 1628.55 -768.51 3.57 0.21 0.56 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 295 156.36 <0.0001 sin(2 * pi * Time) 1 295 34.22 <0.0001 cos(2 * pi * Time) 1 295 3.18 0.0756


28

Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Mare Desvíos estándares relativos al residual y correlaciones (Const) (Const) 0.80 Estructura de correlación Modelo de correlacion: AR(1) Formula: ~ 1 | Mare Parámetros del modelo Estimación Phi 0.61 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Mare Parámetros del modelo Parámetro Estim 1 1.00 2 1.01 3 1.20 4 0.82 5 1.34 6 1.05 7 0.92 8 1.06 9 0.93 10 0.99 11 0.77

Análisis de un modelo ajustado

Cuando InfoStat ajusta un modelo lineal general o mixto con el menú Estimación, se

activa el menú Análisis-exploración de modelos estimados. En este diálogo aparecen

varias solapas como se muestra en la Figura 26.


29

Figura 26: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada (archivo Atriplex.IDB2).

El ejemplo usado en este caso es el del archivo Atriplex.IDB2, sobre el que se estimaron

2 modelos de efectos fijos, el modelo000_PG_REML que contiene los efectos Tamaño,

Episperma y su interacción, y el modelo001_PG_REML que solo contiene los efectos

principales de Tamaño y Episperma.

La solapa Modelos sólo aparece en el caso que haya más de un modelo estimado y

presenta una lista de los modelos evaluados en un “check-list”. Los modelos tildados,

aparecen en una lista con sus estadísticos resumen y una prueba de hipótesis de igualdad

de modelo cuya aplicabilidad debe tomarse con cautela ya que no todos los modelos son

estrictamente comparables. De todas formas los criterios AIC y BIC son buenos

indicadores para seleccionar el modelo más parsimonioso.

La solapa Combinaciones lineales tiene como propósito probar hipótesis sobre

combinaciones lineales. La hipótesis que se prueba es que la esperanza de la

combinación lineal es cero. En esta ventana de diálogo aparecen listados los parámetros

fijos del modelo que se haya seleccionado de la lista que aparece en la parte derecha de

http://dl.dropbox.com/u/65302225/Datos/Atriplex.idb2�


30

la pantalla (Importante: por defecto siempre está seleccionado el último de la lista). En

la parte inferior de la pantalla hay un campo de edición donde pueden especificarse las

constantes de la combinación lineal. A medida que los coeficientes se van agregando,

los parámetros correspondientes se van coloreando para facilitar la especificación de las

constantes, como se ilustra en la Figura 27.

Figura 27: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales desplegada (archivo Atriplex.IDB2).

Finalmente la solapa Diagnóstico tiene 3 subsolapas (Figura 26). La primera,

identificada como “Residuos vs…” tiene dispositivos que sirven para generar de manera

sencilla gráficos del tipo boxplot para los residuos estandarizados vs. cada uno de los

factores fijos del modelo o diagramas de dispersión entre los residuos estandarizados y

las covariables del modelo o los valores predichos. Asimismo, es posible obtener el

gráfico Q-Q plot normal. La segunda solapa, identificada como “ACF-SV”, permite

generar un gráfico de la función de auto-correlación (útil para el diagnóstico de

correlaciones seriales) y la tercera, identificada como LevelPlot, permite generar

gráficos de residuos vs. coordenadas espaciales para generar un mapa del sentido e


31

intensidad de los residuos. Esta herramienta es útil en el diagnóstico de estructuras de

correlación espacial.

Para ejemplificar el uso de la solapa ACF-FV consideremos el ejemplo de los folículos

(archivo Ovary). En este ejemplo se argumentó que la inclusión del término

autorregresivo de orden 1 tenía por objeto corregir una falta de independencia generada

por las discrepancias entre los ciclos individuales de cada yegua respecto de los ciclos

individuales que solo diferían del ciclo promedio poblacional por una constante (Figura

18). El gráfico de la autocorrelación serial de los residuos correspondiente a un modelo

sin la inclusión de la autocorrelación de orden 1 muestra un claro patrón autorregresivo

(Figura 28). Por otra parte, el gráfico de la autocorrelación de los residuos para el

modelo que contempla la autocorrelación mediante un término autorregresivo de orden

1, corrige la falta de independencia (Figura 29).

Figura 28: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) excluyendo la modelación de la autocorrelación serial.


32

Figura 29: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) incluyendo la modelación de la autocorrelación serial.

Las facilidades de la solapa Diagnóstico tienen por propósito permitir al investigador un

rápido diagnóstico de los eventuales problemas de adecuación tanto de la parte fija

como aleatoria del modelo ajustado. En la presentación de ejemplos se ilustrará más

extensamente el uso de estas herramientas.


Ejemplos de Aplicación de Modelos Lineales Generales y Mixtos


Estimación de componentes de varianza

En áreas como el mejoramiento genético animal o vegetal es de particular interés el

cálculo de componentes de varianza. Estos son usados para obtener heredabilidades,

respuesta a la selección, coeficientes de variabilidad genética aditiva, coeficientes de

diferenciación genética, etc. Los modelos lineales mixtos pueden usarse para estimar los

componentes de varianza, por medio del estimador de máxima verosimilitud restringida

(REML).

En muchos estudios de genética de poblaciones se trabaja con varias poblaciones que a

su vez están representadas por uno o más individuos de distintas familias. En este caso

se cuenta con dos factores en el modelo, las poblaciones y las familias dentro de cada

población. Para ejemplificar el uso de componentes de varianza se usan los datos que se

presentan en el archivo Compvar.IDB2 (Navarro et ál. 2005). Estos datos provienen de

un ensayo de siete poblaciones de cedro (Cedrela odorata L.) con un total de 115

familias. Para algunas familias se cuenta con repeticiones y para otras no. Además, el

número de familias dentro de cada población no es el mismo. Las variables registradas

son el largo promedio de las semillas (largo), el diámetro, el largo del tallo y número de

hojas de plantines de cedro.

Además de estimar los componentes de varianza, los investigadores están también

interesados en comparar las medias de las poblaciones. Podemos considerar varios

espacios de inferencia, de acuerdo al diseño y a los intereses de los investigadores. Si

las poblaciones son una muestra aleatoria de un conjunto grande de poblaciones,

entonces la inferencia estará orientada a este conjunto grande de poblaciones. El efecto

de las poblaciones estudiadas es aleatorio, y el interés será la estimación de los

componentes de varianza debida a poblaciones y a familias dentro de poblaciones. Otro

aspecto de interés serán los predictores BLUP de los efectos aleatorios (en especial los

de poblaciones).

Si la inferencia se orienta solamente a las poblaciones estudiadas, el efecto de población

es fijo, y el interés principal es estimar y comparar las medias de poblaciones. Si la

media de una población se interpreta como un promedio a través de todas las posibles

familias de dicha población (no solamente las estudiadas), entonces el efecto de familia

http://dl.dropbox.com/u/65302225/Datos/Compvar.IDB2�


35

es aleatorio. En este caso interesará estimar el componente de varianza debido a familia

dentro de poblaciones, y predecir los efectos de las familias estudiadas (BLUP).

Un tercer espacio de inferencia es cuando el interés reside solamente en las poblaciones

y las familias estudiadas. En este caso ambos efectos son fijos. Este tipo de modelo

presenta severas limitaciones, tanto en su interpretación como en su implementación.

Debido a esto, este modelo no se considerará en este tutorial.

Para el análisis de los datos del archivo Compvar.IDB2 se ajustarán los dos primeros

casos discutidos:

Modelo 1: Poblaciones aleatorias y familias aleatorias

Modelo 2: Poblaciones fijas y familias aleatorias

Primero se selecciona el menú Estadísticas, submenú Modelos lineales generales y

mixtos y escogemos Estimación. Al realizar esta selección aparecerá la ventana de

selección de variables, donde especificamos como variables dependientes a Largo,

Diametro, Largodetallo y Numerodehojas y como criterios de clasificación a Población

y Familia (Figura 30).

Figura 30: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Compvar.IDB2.

http://dl.dropbox.com/u/65302225/Datos/Compvar.IDB2�


36

Modelo 1: Para el cálculo de los componentes de varianza se deben especificar las

variables como en la Figura 30. Posteriormente, en la solapa Efectos aleatorios se debe

declarar primero a Población y luego a Familia, ya que R asume que las distintas

componentes aleatorias que se van agregando secuencialmente están anidadas en los

factores declarados con anterioridad. En la subventana Mostrar se tildaron las opciones

que se muestran en la Figura 31, y se sacó el tilde que tiene por defecto para presentar

los Desvíos estándares relativos al desvío estándar residual.

Figura 31: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 1.

En la solapa Efectos fijos no debe aparecer ningún efecto, y el método de estimación

debe ser el de máxima verosimilitud restringida (REML), que es la opción por defecto.

Observar que se desactivó la opción por defecto Desvíos estándares relativos al desvío

estándar residual, por lo que las estimaciones que aparecen serán directamente los

desvíos estándares absolutos. A continuación se presenta la salida obtenida con estas

especificaciones solo para la variable Largo.


37

Especificación del modelo en R

modelo000_Largo_REML<-lme(Largo~1 ,random=list(Poblacion=pdIdent(~1) ,Familia=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 214 2016.47 2029.91 -1004.23 21.53 0.51 0.76 AIC y BIC menores implica mejor Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Poblacion Desvíos estándares y correlaciones (const) (const) 27.16 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Familia dentro de Poblacion Desvíos estándares y correlaciones (const) (const) 14.80 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~1|Poblacion LI(95%) Est. LS(95%) sd(const) 15.09 27.16 48.89 Formula: ~1|Familia dentro de Poblacion LI(95%) Est. LS(95%) sd(const) 10.72 14.80 20.43 Intervalo de confianza (95%) para sigma lower est. upper sigma 18.77 21.53 24.70


38

A partir de las estimaciones de desvíos e intervalos de confianza para los desvíos, se

obtienen las componentes de varianza y sus intervalos de confianza (Cuadro 1).

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2

Componente Varianza estimada IC para la varianza

Variabilidad relativa al total

(%)

Población 2 227.16 737.66pobσ = = 2 2(15.09 ,48.88 ) 52.0

Familia dentro de población

2 2( ) 14.80 219.04fam pobσ = = 2 2(10.72 ,20.43 ) 15.4

Residual 2 221.53 463.54resσ = = 2 2(18.77 ,24.70 ) 32.6

De acuerdo a los resultados presentados en la tabla anterior, es interesante resaltar que

la variabilidad de la familias dentro de poblaciones es menor que la variabilidad residual

con lo cual no hay una diferenciación de familias dentro de poblaciones. La mayor

variación, en tanto, es atribuible a diferencias entre poblaciones.

Ahora veremos cómo es el diagnóstico para el Modelo 1, es decir, tanto los efectos de

familia como los de población aleatorios. Para esto vamos al submenú Análisis-

exploración de modelos estimados y se solicitan los gráficos de diagnóstico (Figura 32).

El análisis diagnóstico de este modelo permite determinar una fuerte falta de

homogeneidad de varianzas residual (Figura 33).


39

Figura 32: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo 1 con los datos del archivo Compvar.IDB2.

Figura 33: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del archivo Compvar.IDB2.

20 40 60 80

-2-1

01

2

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-3 -2 -1 0 1 2 3

-2-1

01

2

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s


40

En la Figura 33 los residuos estandarizados de Pearsons son aproximaciones de errores

y por lo tanto la heteroscedasticidad observada debe modelarse a este nivel.

Para corregir la falta de homogeneidad a este nivel se considera el Modelo 1 (Población

y Familia como factores aleatorios) con varianzas residuales heterogéneas. Para

incorporar las varianzas residuales eventualmente distintas para cada nivel de

Población, en la solapa heterogeneidad se debe especificar el factor población como se

muestra en la Figura 34.

Figura 34: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la especificación de varianzas heterogéneas para poblaciones.

A continuación se presenta la salida para el Modelo 1 con varianzas residuales

heterogéneas por Población y tildando en la solapa de Efectos aleatorios la opción

Matriz de efectos aleatorios para obtener los estimadores BLUP.


41

Modelos lineales generales y mixtos Especificación del modelo en R modelo004_Largo_REML<-lme(Largo~1 ,random=list(Poblacion=pdIdent(~1) ,Familia=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Poblacion)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo002_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 214 1872.14 1905.75 -926.07 2.32 0.51 0.51 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 21.59 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Poblacion Desvíos estándares y correlaciones (const) (const) 27.72 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Familia dentro de Poblacion Desvíos estándares y correlaciones (const) (const) 1.56 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~1|Poblacion LI(95%) Est. LS(95%) sd(const) 15.61 27.72 49.24 Formula: ~1|Familia dentro de Poblacion LI(95%) Est. LS(95%) sd(const) 0.47 1.56 5.14


42

Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Poblacion Parámetros de la función de varianza Parámetro Estim Charagre 1.00 Escarcega 13.09 Esclavos 11.64 La Paz 15.94 Pacífico Sur 2.81 Xpujil 13.38 Yucatán 12.54 Coeficientes (BLUP) de los efectos aleatorios (~1|Poblacion) const Charagre -41.20 Escarcega 15.42 Esclavos 16.12 La Paz 19.80 Pacífico Sur -36.51 Xpujil 23.29 Yucatán 3.08 Coeficientes (BLUP) de los efectos aleatorios (~1|Familia in Poblacion) const Charagre/Ch_71 -1.07 Charagre/Ch_710 0.59 Charagre/Ch_711 1.31 Charagre/Ch_712 1.42 Charagre/Ch_713 -0.95 Charagre/Ch_714 -1.07 Charagre/Ch_715 -0.70 Charagre/Ch_72 0.70 Charagre/Ch_73 -0.83 Charagre/Ch_74 -0.35 Charagre/Ch_75 -0.59 Charagre/Ch_76 -0.08 Charagre/Ch_77 -0.47 Charagre/Ch_78 0.48 Charagre/Ch_79 1.48 Escarcega/Es_1126 7.2E-04 Escarcega/Es_1127 0.18 Escarcega/Es_1128 0.14 Escarcega/Es_1129 0.07 Escarcega/Es_1130 3.6E-04 Escarcega/Es_1131 -0.06 Escarcega/Es_1132 0.21 Escarcega/Es_1133 0.01 Escarcega/Es_1134 -0.11 Escarcega/Es_1135 -0.09 Escarcega/Es_1136 -0.08 Escarcega/Es_1137 -0.17


43

Escarcega/Es_1138 0.16 Escarcega/Es_1139 -0.08 Escarcega/Es_1142 0.08 Escarcega/Es_1148 -0.20 Esclavos/Ec_31 -0.08 Esclavos/Ec_310 0.08 Esclavos/Ec_311 -0.07 Esclavos/Ec_312 -0.03 Esclavos/Ec_313 -0.22 Esclavos/Ec_314 0.28 Esclavos/Ec_315 -0.34 Esclavos/Ec_316 0.15 Esclavos/Ec_317 0.04 Esclavos/Ec_318 -0.08 Esclavos/Ec_319 0.04 Esclavos/Ec_32 -0.07 Esclavos/Ec_320 0.18 Esclavos/Ec_33 -3.7E-03 Esclavos/Ec_34 -0.11 Esclavos/Ec_35 0.15 Esclavos/Ec_36 -0.17 Esclavos/Ec_37 0.18 Esclavos/Ec_38 0.08 Esclavos/Ec_39 0.05 La Paz/LP_41 -0.13 La Paz/LP_410 0.14 La Paz/LP_411 0.11 La Paz/LP_412 0.16 La Paz/LP_413 -0.08 La Paz/LP_414 -0.01 La Paz/LP_415 -0.13 La Paz/LP_42 0.01 La Paz/LP_43 -0.01 La Paz/LP_44 -0.01 La Paz/LP_45 0.02 La Paz/LP_46 -0.07 La Paz/LP_48 -0.01 La Paz/LP_49 0.07 Pacífico Sur/PS_6204 -0.46 Pacífico Sur/PS_6206 -0.58 Pacífico Sur/PS_6207 0.52 Pacífico Sur/PS_6208 -0.33 Pacífico Sur/PS_6209 -0.15 Pacífico Sur/PS_6210 0.31 Pacífico Sur/PS_6211 -0.22 Pacífico Sur/PS_6212 -0.43 Pacífico Sur/PS_6213 0.03 Pacífico Sur/PS_6214 -0.56 Pacífico Sur/PS_6215 -0.07 Pacífico Sur/PS_6216 1.80 Pacífico Sur/PS_6217 -0.12 Pacífico Sur/PS_6218 0.88 Pacífico Sur/PS_6219 -0.35 Pacífico Sur/PS_6220 -0.51 Pacífico Sur/PS_6221 -0.12 Pacífico Sur/PS_6222 -0.48 Pacífico Sur/PS_660 0.72 Xpujil/Xp_11 -0.12 Xpujil/Xp_110 0.02 Xpujil/Xp_112 3.8E-03 Xpujil/Xp_113 -0.07


44

Xpujil/Xp_114 0.02 Xpujil/Xp_115 -0.12 Xpujil/Xp_116 0.17 Xpujil/Xp_117 0.11 Xpujil/Xp_118 0.08 Xpujil/Xp_119 0.18 Xpujil/Xp_12 -0.01 Xpujil/Xp_120 0.19 Xpujil/Xp_122 -0.21 Xpujil/Xp_123 -0.27 Xpujil/Xp_15 0.02 Xpujil/Xp_16 0.03 Xpujil/Xp_17 0.03 Xpujil/Xp_18 -0.05 Xpujil/Xp_19 0.07 Yucatán/Yu_1111 -0.17 Yucatán/Yu_1114 -0.19 Yucatán/Yu_1115 -0.04 Yucatán/Yu_1116 0.02 Yucatán/Yu_1117 0.05 Yucatán/Yu_1118 0.03 Yucatán/Yu_1119 0.10 Yucatán/Yu_1121 -0.06 Yucatán/Yu_1122 0.20 Yucatán/Yu_1123 -0.09 Yucatán/Yu_1124 -0.05 Yucatán/Yu_1125 0.20 Intervalo de confianza (95%) para sigma lower est. upper sigma 1.59 2.32 3.38

Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas

heterogéneas para Población y Familia dentro de Población. Observamos que las

varianzas de las poblaciones son bien diferentes: La población La Paz tiene la mayor

varianza estimada en (15.94*2.32)2 = 1367.57 mientras que la de menor varianza es

(1*2.32)2 = 5.38. Al comparar los modelos con varianzas heterogéneas y homogéneas

mediante una prueba de cociente de verosimilitud se corrobora que el modelo con

varianzas heterogéneas es el mejor (p<0.0001) como se muestra en la siguiente salida.

Comparación de modelos Call Model df AIC BIC logLik Test L.Ratio p-value Modelo000_Largo_REML 1 1 4 2016.47 2029.91 -1004.23 Modelo001_Largo_REML 2 2 10 1872.14 1905.75 -926.07 1 vs 2 156.33 <0.0001


45

Los residuos obtenidos para el Modelo 1 con varianzas distintas en cada población no

muestran problemas de heteroscedasticidad y presentan una mejora en los supuestos

distribucionales respecto al Modelo 1 con varianzas homogéneas (Figura 35).

Figura 35: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas residuales heterogéneas para poblaciones y los datos del archivo Compvar.IDB2.

Modelo 2: Para este modelo se debe declarar Población en la solapa de Efectos fijos.

Observar que en esta solapa se ha seleccionado además Coeficientes de los efectos fijos

(Figura 36). En la solapa de Efectos aleatorios se ha declarado familias como aleatorio,

se ha deseleccionado la opción por defecto de familia como efecto sobre la Constante

(intercepto), y se ha seleccionado familia como afectando los parámetros del efecto

población. La matriz de covarianzas de los efectos aleatorios asignados a poblaciones se

suponen independientes (pdIdent). Se han seleccionado además las opciones Matriz de

efectos aleatorios, Intervalo de confianza para los parámetros de la parte aleatoria e

Intervalo de confianza para sigma (Figura 37). En la solapa Comparaciones se

seleccionó la opción DGC para Población (Figura 38).

10 20 30 40 50 60 70

-2-1

01

23

Valores ajustados

Res

.con

d.es

tand

.Pea

rson

-3 -2 -1 0 1 2 3

-2-1

01

23

Cuantiles teóricos

Cua

ntile

s m

uest

rale

s


46

Figura 36: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.

Figura 37: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.


47

Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la especificación del Modelo 2.

A continuación se presenta la salida correspondiente a estas especificaciones:

Especificación del modelo en R modelo001_Largo_REML<-lme(Largo~1+Poblacion ,random=list(Familia=pdIdent(~Poblacion-1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 214 1967.65 1997.64 -974.82 21.54 0.51 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 601.79 <0.0001 Poblacion 6 108 27.23 <0.0001


48

Efectos fijos Value Std.Error DF t-value p-value (Intercept) 8.23 5.75 108 1.43 0.1551 PoblacionEscarcega 56.89 8.03 108 7.08 <0.0001 PoblacionEsclavos 57.72 7.46 108 7.74 <0.0001 PoblacionLa Paz 62.24 8.13 108 7.66 <0.0001 PoblacionPacífico Sur 4.65 7.53 108 0.62 0.5382 PoblacionXpujil 65.45 7.72 108 8.48 <0.0001 PoblacionYucatán 44.44 8.40 108 5.29 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Poblacion - 1|Familia Desvíos estándares y correlaciones Charagre Escarcega Esclavos La Paz Pacífico Sur XpujilYucatán Charagre 14.79 0.00 0.00 0.00 0.00 0.00 0.00 Escarcega 0.00 14.79 0.00 0.00 0.00 0.00 0.00 Esclavos 0.00 0.00 14.79 0.00 0.00 0.00 0.00 La Paz 0.00 0.00 0.00 14.79 0.00 0.00 0.00 Pacífico Sur 0.00 0.00 0.00 0.00 14.79 0.00 0.00 Xpujil 0.00 0.00 0.00 0.00 0.00 14.79 0.00 Yucatán 0.00 0.00 0.00 0.00 0.00 0.00 14.79 Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~Poblacion - 1|Familia LI(95%) est. LS(95%) sd( - 1) 10.71 14.79 20.42 Coeficientes (BLUP) de los efectos aleatorios (~Poblacion - 1|Familia) Charagre Escarcega Esclavos La Paz Pacífico Sur Xpujil Yucatán Ch_71 -1.08 0.00 0.00 0.00 0.00 0.00 0.00 Ch_710 0.62 0.00 0.00 0.00 0.00 0.00 0.00 Ch_711 1.34 0.00 0.00 0.00 0.00 0.00 0.00 Ch_712 1.47 0.00 0.00 0.00 0.00 0.00 0.00 Ch_713 -0.96 0.00 0.00 0.00 0.00 0.00 0.00 Ch_714 -1.08 0.00 0.00 0.00 0.00 0.00 0.00 Ch_715 -0.71 0.00 0.00 0.00 0.00 0.00 0.00 Ch_72 0.73 0.00 0.00 0.00 0.00 0.00 0.00 Ch_73 -0.84 0.00 0.00 0.00 0.00 0.00 0.00 Ch_74 -0.35 0.00 0.00 0.00 0.00 0.00 0.00 Ch_75 -0.60 0.00 0.00 0.00 0.00 0.00 0.00 Ch_76 -0.07 0.00 0.00 0.00 0.00 0.00 0.00 Ch_77 -0.48 0.00 0.00 0.00 0.00 0.00 0.00 Ch_78 0.50 0.00 0.00 0.00 0.00 0.00 0.00 Ch_79 1.53 0.00 0.00 0.00 0.00 0.00 0.00 Ec_31 0.00 0.00 -6.04 0.00 0.00 0.00 0.00 Ec_310 0.00 0.00 5.36 0.00 0.00 0.00 0.00 Ec_311 0.00 0.00 -5.56 0.00 0.00 0.00 0.00 Ec_312 0.00 0.00 -2.65 0.00 0.00 0.00 0.00 Ec_313 0.00 0.00 -16.00 0.00 0.00 0.00 0.00 Ec_314 0.00 0.00 20.66 0.00 0.00 0.00 0.00 Ec_315 0.00 0.00 -25.46 0.00 0.00 0.00 0.00 Ec_316 0.00 0.00 10.95 0.00 0.00 0.00 0.00 Ec_317 0.00 0.00 2.69 0.00 0.00 0.00 0.00 Ec_318 0.00 0.00 -5.80 0.00 0.00 0.00 0.00 Ec_319 0.00 0.00 2.94 0.00 0.00 0.00 0.00 Ec_32 0.00 0.00 -5.56 0.00 0.00 0.00 0.00 Ec_320 0.00 0.00 12.89 0.00 0.00 0.00 0.00 Ec_33 0.00 0.00 -0.46 0.00 0.00 0.00 0.00


49

Ec_34 0.00 0.00 -7.99 0.00 0.00 0.00 0.00 Ec_35 0.00 0.00 10.95 0.00 0.00 0.00 0.00 Ec_36 0.00 0.00 -12.84 0.00 0.00 0.00 0.00 Ec_37 0.00 0.00 12.89 0.00 0.00 0.00 0.00 Ec_38 0.00 0.00 5.36 0.00 0.00 0.00 0.00 Ec_39 0.00 0.00 3.67 0.00 0.00 0.00 0.00 Es_1126 0.00 -0.06 0.00 0.00 0.00 0.00 0.00 Es_1127 0.00 16.20 0.00 0.00 0.00 0.00 0.00 Es_1128 0.00 16.63 0.00 0.00 0.00 0.00 0.00 Es_1129 0.00 6.49 0.00 0.00 0.00 0.00 0.00 Es_1130 0.00 -0.04 0.00 0.00 0.00 0.00 0.00 Es_1131 0.00 -7.09 0.00 0.00 0.00 0.00 0.00 Es_1132 0.00 19.12 0.00 0.00 0.00 0.00 0.00 Es_1133 0.00 1.15 0.00 0.00 0.00 0.00 0.00 Es_1134 0.00 -10.25 0.00 0.00 0.00 0.00 0.00 Es_1135 0.00 -10.94 0.00 0.00 0.00 0.00 0.00 Es_1136 0.00 -7.58 0.00 0.00 0.00 0.00 0.00 Es_1137 0.00 -16.32 0.00 0.00 0.00 0.00 0.00 Es_1138 0.00 14.26 0.00 0.00 0.00 0.00 0.00 Es_1139 0.00 -10.30 0.00 0.00 0.00 0.00 0.00 Es_1142 0.00 7.71 0.00 0.00 0.00 0.00 0.00 Es_1148 0.00 -18.99 0.00 0.00 0.00 0.00 0.00 LP_41 0.00 0.00 0.00 -18.43 0.00 0.00 0.00 LP_410 0.00 0.00 0.00 18.95 0.00 0.00 0.00 LP_411 0.00 0.00 0.00 14.82 0.00 0.00 0.00 LP_412 0.00 0.00 0.00 20.89 0.00 0.00 0.00 LP_413 0.00 0.00 0.00 -12.12 0.00 0.00 0.00 LP_414 0.00 0.00 0.00 -2.41 0.00 0.00 0.00 LP_415 0.00 0.00 0.00 -18.67 0.00 0.00 0.00 LP_42 0.00 0.00 0.00 1.23 0.00 0.00 0.00 LP_43 0.00 0.00 0.00 -1.93 0.00 0.00 0.00 LP_44 0.00 0.00 0.00 -1.68 0.00 0.00 0.00 LP_45 0.00 0.00 0.00 1.96 0.00 0.00 0.00 LP_46 0.00 0.00 0.00 -9.69 0.00 0.00 0.00 LP_48 0.00 0.00 0.00 -2.39 0.00 0.00 0.00 LP_49 0.00 0.00 0.00 9.48 0.00 0.00 0.00 PS_6204 0.00 0.00 0.00 0.00 -2.13 0.00 0.00 PS_6206 0.00 0.00 0.00 0.00 -2.73 0.00 0.00 PS_6207 0.00 0.00 0.00 0.00 2.48 0.00 0.00 PS_6208 0.00 0.00 0.00 0.00 -1.52 0.00 0.00 PS_6209 0.00 0.00 0.00 0.00 -0.67 0.00 0.00 PS_6210 0.00 0.00 0.00 0.00 1.51 0.00 0.00 PS_6211 0.00 0.00 0.00 0.00 -1.03 0.00 0.00 PS_6212 0.00 0.00 0.00 0.00 -2.01 0.00 0.00 PS_6213 0.00 0.00 0.00 0.00 0.18 0.00 0.00 PS_6214 0.00 0.00 0.00 0.00 -2.61 0.00 0.00 PS_6215 0.00 0.00 0.00 0.00 -0.31 0.00 0.00 PS_6216 0.00 0.00 0.00 0.00 8.55 0.00 0.00 PS_6217 0.00 0.00 0.00 0.00 -0.55 0.00 0.00 PS_6218 0.00 0.00 0.00 0.00 4.18 0.00 0.00 PS_6219 0.00 0.00 0.00 0.00 -1.64 0.00 0.00 PS_6220 0.00 0.00 0.00 0.00 -2.37 0.00 0.00 PS_6221 0.00 0.00 0.00 0.00 -0.55 0.00 0.00 PS_6222 0.00 0.00 0.00 0.00 -2.25 0.00 0.00 PS_660 0.00 0.00 0.00 0.00 3.46 0.00 0.00 Xp_11 0.00 0.00 0.00 0.00 0.00 -14.96 0.00 Xp_110 0.00 0.00 0.00 0.00 0.00 2.35 0.00 Xp_112 0.00 0.00 0.00 0.00 0.00 -0.09 0.00 Xp_113 0.00 0.00 0.00 0.00 0.00 -7.12 0.00 Xp_114 0.00 0.00 0.00 0.00 0.00 1.61 0.00 Xp_115 0.00 0.00 0.00 0.00 0.00 -12.46 0.00 Xp_116 0.00 0.00 0.00 0.00 0.00 15.93 0.00 Xp_117 0.00 0.00 0.00 0.00 0.00 10.11 0.00 Xp_118 0.00 0.00 0.00 0.00 0.00 6.95 0.00 Xp_119 0.00 0.00 0.00 0.00 0.00 16.91 0.00 Xp_12 0.00 0.00 0.00 0.00 0.00 -2.14 0.00 Xp_120 0.00 0.00 0.00 0.00 0.00 18.36 0.00 Xp_122 0.00 0.00 0.00 0.00 0.00 -20.72 0.00 Xp_123 0.00 0.00 0.00 0.00 0.00 -27.03 0.00 Xp_15 0.00 0.00 0.00 0.00 0.00 1.86 0.00 Xp_16 0.00 0.00 0.00 0.00 0.00 2.99 0.00 Xp_17 0.00 0.00 0.00 0.00 0.00 3.95 0.00 Xp_18 0.00 0.00 0.00 0.00 0.00 -4.94 0.00 Xp_19 0.00 0.00 0.00 0.00 0.00 8.44 0.00 Yu_1111 0.00 0.00 0.00 0.00 0.00 0.00 -14.89 Yu_1114 0.00 0.00 0.00 0.00 0.00 0.00 -16.59 Yu_1115 0.00 0.00 0.00 0.00 0.00 0.00 -3.24


50

Yu_1116 0.00 0.00 0.00 0.00 0.00 0.00 1.86 Yu_1117 0.00 0.00 0.00 0.00 0.00 0.00 4.53 Yu_1118 0.00 0.00 0.00 0.00 0.00 0.00 2.83 Yu_1119 0.00 0.00 0.00 0.00 0.00 0.00 8.66 Yu_1121 0.00 0.00 0.00 0.00 0.00 0.00 -5.18 Yu_1122 0.00 0.00 0.00 0.00 0.00 0.00 17.15 Yu_1123 0.00 0.00 0.00 0.00 0.00 0.00 -7.85 Yu_1124 0.00 0.00 0.00 0.00 0.00 0.00 -4.45 Yu_1125 0.00 0.00 0.00 0.00 0.00 0.00 17.15 Intervalo de confianza (95%) para sigma lower est. upper sigma 18.77 21.54 24.71 Medias ajustadas y errores estándares para Poblacion DGC (alfa=0.05) Poblacion Medias E.E. Xpujil 73.68 5.16 A La Paz 70.47 5.74 A Esclavos 65.95 4.75 A Escarcega 65.12 5.61 A Yucatán 52.67 6.13 A Pacífico Sur 12.88 4.87 B Charagre 8.23 5.75 B Medias con una letra común no son significativamente diferentes (p<= 0.05)

A continuación se muestra como ejemplo el cálculo de los BLUP para algunas familias

de la población Charagre:

,71 71( )

,72 72( )

,73 73( )

,74 74( )

ˆˆ ˆˆ 8.2296 0 ( 1.0823) 7.1473ˆˆ ˆˆ 8.2296 0 0.7277 8.9573ˆˆ ˆˆ 8.2296 0 ( 0.8396) 7.3900ˆˆ ˆˆ 8.2296 0 ( 0.354

cha cha cha

cha cha cha

cha cha cha

cha cha cha

Y

Y

Y

Y

µ α β

µ α β

µ α β

µ α β

= + + = + + − =

= + + = + + =

= + + = + + − =

= + + = + + − 2) 7.8754=

El BLUP de la familia 42 de la población La Paz se calcula como:

,42 42( )ˆˆ ˆˆ 8.2296 62.2374 1.2297 71.6967lpaz lpaz lpazY µ α β= + + = + + =

Ahora realizaremos el análisis del ajuste del Modelo 2. En el submenú Análisis-

exploración de modelos estimados se pidieron los gráficos de diagnóstico (Figura 39).


51

Figura 39: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo 2 con los datos del archivo Compvar.IDB2.

El gráfico de residuos condicionales estandarizados de Pearson vs. Valores ajustados

(Figura 40) muestra varianzas residual heterogéneas para la variable Largo.


52

Figura 40: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo Compvar.IDB2

Respecto a los supuestos distribucionales, es importante destacar que, existiendo

heteroscedasticidad, el Q-Q plot no debe ser interpretado hasta tanto no se corrija este

problema. Para incorporar las varianzas heterogéneas del efecto Población, en la solapa

heterogeneidad se debe especificar el factor Población como se mostró en la Figura 34.

Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas

heterogéneas para Población. Observamos que las varianzas de las poblaciones son bien

diferentes: La población La Paz tiene la mayor varianza estimada en (15.94*2.32)2 =

1367.57, mientras que la de menor varianza es Charagre con (1*2.32)2 = 5.38.

Modelos lineales generales y mixtos Especificación del modelo en R


53

modelo002_Largo_REML<-lme(Largo~1+Poblacion ,random=list(Familia=pdIdent(~Poblacion-1)) ,weight=varComb(varIdent(form=~1|Poblacion)) ,method="REML" ,na.action=na.omit ,data=R.data01 ,keep.data=FALSE) Resultados para el modelo: modelo002_Largo_REML Variable dependiente:Largo Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 214 1823.20 1873.20 -896.60 2.32 0.51 0.51 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 108 509.60 <0.0001 Poblacion 6 108 86.55 <0.0001 Efectos fijos Value Std.Error DF t-value p-value (Intercept) 8.23 0.61 108 13.42 <0.0001 PoblacionEscarcega 57.32 5.90 108 9.72 <0.0001 PoblacionEsclavos 57.72 4.33 108 13.33 <0.0001 PoblacionLa Paz 62.33 7.16 108 8.70 <0.0001 PoblacionPacífico Sur 4.65 1.28 108 3.65 0.0004 PoblacionXpujil 65.43 5.54 108 11.81 <0.0001 PoblacionYucatán 44.44 6.00 108 7.41 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Poblacion - 1|Familia Desvíos estándares y correlaciones Charagre Escarcega Esclavos La Paz Pacífico Sur Xpujil Yucatán Charagre 1.56 0.00 0.00 0.00 0.00 0.00 0.00 Escarcega 0.00 1.56 0.00 0.00 0.00 0.00 0.00 Esclavos 0.00 0.00 1.56 0.00 0.00 0.00 0.00 La Paz 0.00 0.00 0.00 1.56 0.00 0.00 0.00 Pacífico Sur 0.00 0.00 0.00 0.00 1.56 0.00 0.00 Xpujil 0.00 0.00 0.00 0.00 0.00 1.56 0.00 Yucatán 0.00 0.00 0.00 0.00 0.00 0.00 1.56

Intervalos de confianza (95%) para los parámetros de los efectos aleatorios Formula: ~Poblacion - 1|Familia LI(95%) Est. LS(95%) sd( - 1) 0.45 1.56 5.38 Estructura de varianzas Modelo de varianzas: varIdent


54

Formula: ~ 1 | Poblacion Parámetros de la función de varianza Parámetro Estim Charagre 1.00 Esclavos 11.64 Escarcega 13.09 La Paz 15.94 Pacífico Sur 2.81 Xpujil 13.38 Yucatán 12.55

Para probar que este modelo menos parsimonioso es el de mejor ajuste se realizó una

prueba del cociente de verosimilitud cuya salida se presenta a continuación.

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 001 9 1967.65 1997.64 -974.82

002 15 1823.20 1873.20 -896.60 1 vs 2 156.44 <0.0001

El modelo con varianzas heterogéneas para las distintas poblaciones es mejor que el de

varianzas homogéneas (p<0.0001). Podemos observar que con la inclusión de varianzas

heterogéneas para las distintas poblaciones el ajuste ha mejorado respecto a los ajustes

anteriores (Figura 41). Tanto en los box-plot de los residuos condicionales

estudentizados de Pearson como en el diagrama de dispersión de residuos condicionales

estudentizados de Pearson versus predichos, ya no se evidencian problemas graves de

falta de homogeneidad de varianzas. En el gráfico Q-Q plot se observa una mejora en el

supuesto distribucional.


55

Figura 41: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del archivo Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población.


56

Efectos aleatorios cruzados con interacción

Existen muchas situaciones en las que resulta de interés estimar componentes de

varianza asociados con dos factores cruzados y su interacción. Milliken y Johnson

(1992, p. 265) presentan un ejemplo donde se analizan datos de eficiencia de

producción para tres líneas de producción aleatoriamente escogidas en una fábrica. Se

escogieron aleatoriamente cuatro operarios, y estos operarios trabajaron en cada una de

las líneas de producción. Originalmente cada operario iba a trabajar en cada línea de

producción cinco veces, pero por diversas razones hay combinaciones que se repitieron

menos veces (hay entre uno y cinco datos en cada combinación de operario y línea de

producción).

Como tanto el efecto de la línea de producción como el del operario son aleatorios, y

además interesa la variabilidad adicional generada por la combinación específica

operario × línea, vamos a usar un modelo con dos efectos aleatorios y su interacción:

( ) ( )( ) ( )

2 2

2 2

~ 0, , ~ 0,

~ 0, , ~ 0,

ijk i j ij ijk

i a j b

ij ab ijk e

Y a b ab e

a N b N

ab N e N

µ

σ σ

σ σ

= + + + +

(6)

donde todos los efectos aleatorios son mutuamente independientes.

Para ajustar este modelo usaremos el conjunto de datos Produccion.IDB2 (Milliken y

Johnson, 1992). Eficiencia se declara en la ventana Variables, Línea y Operario se

declaran en la ventana Criterios de clasificación. Como no hay ningún efecto fijo

(excepto la media general), no se pone nada en la solapa Efectos fijos. En la solapa

Efectos aleatorios se selecciona Línea y Operario, y al oprimir el botón derecho del

ratón con ambas variables seleccionadas aparecerá la opción Factores aleatorios

cruzados más interacciones. Para simplificar la lectura de la salida (recordemos que el

objetivo principal de este tipo de modelos es la estimación de las componentes de

varianza), hemos desactivado la opción Desvíos estándares relativos al desvío estándar

residual.

http://dl.dropbox.com/u/65302225/Datos/Produccion.IDB2�


57

Figura 42: Ventana Modelos lineales generales y mixtos con la solapa Efectos aleatorios desplegada para los datos del archivo Producciones.IDB2 con los efectos aleatorios Linea y Operario cruzados y

su interacción.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.001_eficiencia_REML<-lme(eficiencia~1 ,random=list(.U.=pdBlocked(list(pdIdent(~linea-1) ,pdIdent(~operario-1) ,pdIdent(~linea:operario-1)))) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data01 ,keep.data=FALSE) Resultados para el modelo: modelo.001_eficiencia_REML Variable dependiente: eficiencia


58

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 47 249.6353 258.7785 -119.8176 1.9947 0.9497 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 46 478.2937 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdBlocked Formula: ~linea + operario + linea:operario - 1 Desvíos estándares y correlaciones D.S. linea1 5.6672 linea2 5.6672 linea3 5.6672 operario1 1.7353 operario2 1.7353 operario3 1.7353 operario4 1.7353 linea1:operario1 5.9618 linea2:operario1 5.9618 linea3:operario1 5.9618 linea1:operario2 5.9618 linea2:operario2 5.9618 linea3:operario2 5.9618 linea1:operario3 5.9618 linea2:operario3 5.9618 linea3:operario3 5.9618 linea1:operario4 5.9618 linea2:operario4 5.9618 linea3:operario4 5.9618

A partir de esta salida podemos observar los estimadores de las desviaciones estándares

de cada efecto aleatorio:

ˆ ˆ ˆ ˆ5.6672, 1.7353, 5.9618, 1.9947a b ab eσ σ σ σ= = = =

Esta información puede usarse, por ejemplo, para estimar distintos tipos de

correlaciones Intra-clase. Por ejemplo, la correlación entre dos observaciones de la

misma línea de producción y del mismo operario es:


59

( ) ( ) ( )

2 2 2'

' 2 2 2 2

2 2 2

2 2 2 2

cov , ˆ ˆ ˆcorr ,

ˆ ˆ ˆ ˆvar

5.6672 1.7353 5.9618 0.94675.6672 1.7353 5.9618 1.9947

ijk ijk a b abijk ijk

a b ab eijk

Y YY Y

Yσ σ σ

σ σ σ σ+ +

= =+ + +

+ += =

+ + +

Por otro lado, la correlación entre dos observaciones del mismo operario pero en líneas

de producción diferentes es mucho menor:

( ) ( ) ( )

' '' '

2 2

2 2 2 2 2 2 2 2

cov ,corr ,

var

ˆ 1.7353 0.0403.ˆ ˆ ˆ ˆ 5.6672 1.7353 5.9618 1.9947

ijk i jkijk i jk

ijk

b

a b ab e

Y YY Y

Y

σσ σ σ σ

=

= = =+ + + + + +


60

Aplicación de modelos mixtos para datos estratificados

Parcelas divididas

Supongamos un experimento bifactorial en el que no es posible asignar al azar las

combinaciones de ambos factores a las parcelas experimentales (PE). En algunos casos,

grupos de PE reciben aleatoriamente los distintos niveles de uno de los factores de

clasificación y dentro de estos grupos de parcelas, los niveles del segundo factor son

asignados al azar.

El experimento descripto anteriormente difiere de un experimento bifactorial

convencional en que, si bien los niveles de los factores son asignados aleatoriamente a

las PE, no son los tratamientos (i.e. las combinaciones de los niveles de los factores) los

que están siendo asignados de esta forma. Esta manera particular de asignar los distintos niveles de los factores a las parcelas

representa una restricción a la aleatorización, e induce estructuras de correlación que

deben ser tenidas en cuenta en el momento del análisis. Este diseño se conoce como

parcela dividida. El nombre surge de la idea de que PARCELAS principales reciben los niveles de un

factor (también llamado a veces factor principal) y que estas parcelas son DIVIDIDAS

en SUBPARCELAS que reciben los niveles del segundo factor de clasificación. Aunque en las parcelas divididas los niveles de un factor son asignados dentro de los

niveles de otro factor, este NO ES un diseño anidado. Se trata de un experimento

típicamente factorial donde los factores están cruzados. Es sólo la aleatorización la que

se ha realizado en forma secuencial. De acuerdo a la forma en que están arregladas las parcelas principales, el diseño puede

ser de:

• Parcelas divididas en un arreglo en bloques

• Parcelas divididas en un arreglo completamente aleatorizado

• Parcelas divididas en otros diseños


61

Parcelas divididas en un arreglo en bloques

El análisis clásico de un diseño en parcelas divididas con parcelas principales

distribuidas en bloques completos incluye los siguientes términos en el modelo:

Factor asociado a la parcela principal (FPP)

Bloque

Bloque*FPP (error de la parcela principal)

Factor asociado a la subparcela (FSP)

FPP*FSP

Error (error para la subparcela)

El punto clave para completar el análisis de este modelo es comprender que el error

experimental para el FPP es diferente que para los términos del modelo que incluyen al

FSP. El error experimental de las parcelas principales es mayor que el de las

subparcelas.

La varianza del error experimental de las parcelas principales en un diseño de parcelas

divididas con parcelas principales repetidas en bloque completamente aleatorizados, se

estima como el cuadrado medio (CM) de la interacción Bloque*FPP (se asume que no

hay interacción Bloque*FPP y en consecuencia este CM estima el error entre parcelas

principales tratadas de la misma forma). El CM de esta “interacción” es el que se usa

como referencia para calcular el estadístico F de la prueba de hipótesis para el factor

principal. El resto de las pruebas el CM residual es el apropiado para construir el

estadístico F.

El análisis de este diseño mediante un modelo lineal mixto se basa en la identificación

de dos niveles de agrupamiento de las observaciones. El primer nivel está dado por los

bloques y el segundo nivel por las parcelas principales dentro de los bloques. Cada uno

de estos niveles de agrupamiento genera una correlación, conocida como correlación

intraclase, entre las observaciones que contiene.

El modelo lineal mixto para este diseño es el siguiente:

; 1,.., ; 1,..., ; 1,...,ijk i j ij k ik ijky b p i T j G k Bµ τ γ δ ε= + + + + + + = = = (7)


62

donde ijky representa la respuesta observada en el k-ésimo bloque, i-ésimo nivel del

factor principal y j-ésimo nivel de factor asociado a las subparcelas, µ representa la

media general de la respuesta, iτ representa el efecto del i-ésimo nivel del factor

asociado a las parcelas principales, jγ representa el efecto del j-ésimo nivel del factor

asociado a las subparcelas y ijδ representa el efecto de la interacción del ij-ésimo

tratamiento. Por otra parte kb , ikp y ijkε corresponden a efectos aleatorios de los bloques,

de las parcelas dentro de los bloques y de los errores experimentales. Las suposiciones

sobre estos componentes aleatorios es que ( )2~ 0,k bb N σ , ( )2~ 0,ik pp N σ ,

( )2~ 0,ijk N εε σ y que estos tres componentes aleatorios son independientes. A

continuación ejemplificaremos el análisis de un diseño en parcelas divididas en bloques

mediante la aplicación de un modelo lineal mixto.

En este ejemplo (Di Rienzo 2007) se evalúan 4 variedades de trigo: BUCK-Charrua

(BC), Las Rosas-INTA (LI), Pigué (Pe) y Pro-INTA Puntal (PP) bajo riego y secano

con el diseño a campo presentado en la Figura 43.

Bloque 1 BC Pe PP LI

LI BC Pe PP

Bloque 2 PP BC Pe LI

PP Pe LI BC

Bloque 3 Pe LI BC PP

BC PP Pe LI

Figura 43: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2 (gris oscuro=parcelas bajo riego, gris claro=parcelas en secano)


63

Los datos de este ejemplo se encuentran en el archivo Trigo.IDB2. El encabezamiento

de la tabla de datos es la siguiente (Figura 44).

Figura 44: Encabezamiento de la tabla de datos del archivo Trigo.IDB2.

El factor en la parcela principal es Agua, el factor asociado a las subparcelas es

Variedad y la variable de respuesta es el Rendimiento. Los bloques están claramente

identificados, pero las parcelas principales no aparecen explícitamente. Esto es así

porque en un diseño en parcelas divididas, las parcelas principales dentro de un bloque

están confundidas con el factor principal. De esta forma las observaciones bajo “Riego”

en el bloque 1, representan las observaciones de una de las parcelas principales de ese

bloque.

Para analizar este ejemplo invocaremos la estimación de un modelo lineal mixto. Esta

invocación nos presentará, como es usual, la ventana de selección de variables. Su

imagen, con la selección apropiada de variables de respuesta y factores se muestra en la

Figura 45.

Figura 45: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Trigo.IDB2.

http://dl.dropbox.com/u/65302225/Datos/Trigo.IDB2�


64

Aceptando esta especificación, se mostrará el diálogo que permite especificar el

modelo. La solapa de la parte fija, ya especificada, se muestra en la Figura 46. En ella

aparecen los efectos principales Agua, Variedad y la interacción Agua*Variedad.

Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2.

Para la especificación de la parte aleatoria, en la solapa Efectos aleatorios se debe

incorporar primero al factor Bloque y después al factor Agua. Esta es la forma de indicar

que Agua está dentro de Bloque. La especificación de la parte aleatoria queda como se

muestra en la Figura 47.


65

Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y agua como criterios de estratificación.

La salida correspondiente a esta estimación es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Rendimiento_REML<-lme(Rendimiento~1+Agua+Variedad+Agua:Variedad ,random=list(Bloque=pdIdent(~1) ,Agua=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 24 206.59 215.09 -92.30 51.65 0.84 0.89 0.91 AIC y BIC menores implica mejor


66

Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 12 363.93 <0.0001 Agua 1 2 55.24 0.0176 Variedad 3 12 6.38 0.0078 Agua:Variedad 3 12 2.36 0.1223 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.55 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Agua dentro de Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.47

Las pruebas de hipótesis secuenciales dan los mismos resultados que las marginales en

este caso porque los datos son balanceados.

Antes de continuar con nuestro análisis, haremos algunas validaciones simples de las

suposiciones de estos modelos, revisando residuales estandarizados vs. predichos y

otros criterios de clasificación, así como el Q-Q plot normal de residuos estandarizados.

Estos residuos son condicionales a los efectos aleatorios (es decir, aproximan los

errores). Para ello invocaremos el submenú Análisis-exploración de modelos estimados.

En el diálogo, seleccionaremos la solapa Diagnóstico y dentro de ella la subsolapa

Residuos vs. (Figura 48).


67

Figura 48: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada para los datos del archivo Trigo.IDB2.

Si se seleccionan los ítems dentro de la lista disponible, como se muestra en la Figura

48, se obtendrá el gráfico siguiente (Figura 49). Este aparece en una nueva ventana que

genera R y su contenido puede copiarse oprimiendo el botón derecho del ratón, sobre la

imagen. En el menú que se despliega se podrá optar por “Copy as metafile” o “Copy as

bitmap”.


68

Figura 49: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2.

Un examen rápido de la figura sugiere una posible heterogeneidad de varianzas entre

variedades. Para poder probar si es necesario incluir la estimación de varianzas

residuales diferentes para cada variedad hay que ajustar un modelo heteroscedástico y

compararlo con el homoscedástico, utilizando algún criterio como el AIC o BIC (o una

prueba del cociente de verosimilitud, ya que el modelo homoscedástico es un caso

particular del heteroscedástico).

Para ajustar el modelo heteroscedástico invocamos nuevamente al módulo de

estimación de los modelos mixtos y en la solapa Heteroscedasticidad seleccionamos el

modelo varIdent y una vez seleccionado hacemos doble clic sobre Variedad (en la lista

a la derecha de la ventana) para especificar a esta variable como criterio de

agrupamiento (Figura 50). Luego accionamos el botón Agregar para hacer efectiva la


69

incorporación de esta especificación del modelo. Si por algún motivo la especificación

ingresada no es deseada, haciendo doble clic sobre la misma, ésta se borra.

Figura 50: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con selección de función varIdent con variedad como criterio de agrupamiento.

Las medidas de ajuste del modelo especificado son las siguientes:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 24 209.47 220.28 -90.73 24.49 0.84 0.89 0.90 AIC y BIC menores implica mejor

Comparadas con las del modelo homoscedástico, no se observa una mejoría, por lo

contrario tanto AIC como BIC aumentaron. Por este motivo se descarta el modelo

heteroscedástico.


70

Luego volviendo al modelo homoscedástico, realizaremos comparaciones múltiples del

tipo LSD de Fisher para evaluar diferencias entre variedades. Para ello en la solapa

Comparaciones subsolapa Medias, tildaremos la opción Variedad como se muestra la

Figura 51.

Figura 51: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y selección de la subsolapa Medias.

Al final de la salida del programa se encontrará la comparación de medias. Se observa

que solo BUCK-Charrua tuvo los rendimientos más bajos y esto ocurrió

independientemente de si tenía riego o no. En tanto las otras variedades tuvieron

rendimientos estadísticamente indistinguibles.

Medias ajustadas y errores estándares para Variedad LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Variedad Medias E.E. Pro-INTA Puntal 469.50 28.48 A Pigue 430.98 28.48 A LasRosas-INTA 423.98 28.48 A BUCK-Charrua 342.73 28.48 B Medias con una letra común no son significativamente diferentes (p<= 0.05)


71

Parcelas divididas en un arreglo en diseño completamente aleatorizado

A continuación ejemplificamos mediante un

experimento cuyo objetivo fue evaluar el efecto de un

coadyuvante sobre la cobertura de gotas y uniformidad

de aplicación en distintas ubicaciones de las hojas

dentro del canopeo de un cultivo de soja (Di Rienzo

2007). Para ello se seleccionaron 16 sitios en cada uno

de los cuales se dispusieron 4 tarjetas hidro-sensibles,

ubicadas a dos alturas del canopeo (inferior, superior) y

apuntando, sus caras sensibles, en dos direcciones: hacia

arriba y hacia abajo. Las tarjetas hidrosensibles

muestran una mancha en el lugar donde cae una gota de

agua. La superficie manchada en estas tarjetas es una

medida de cuanto penetra y se dispersa el agua en una zona dada del canopeo. En 8 de

los 16 sitios se agregó al agua de pulverización un coadyuvante (para disminuir la

tensión superficial del agua y mejorar la dispersión de las gotas) y en los 8 restantes no.

Por lo tanto en cada sitio de pulverización se obtienen 4 lecturas correspondientes a las

combinaciones de las alturas (inferior y superior) y la ubicación de la cara sensible de la

tarjeta (abajo y arriba). Luego en cada sitio hay una repetición completa de un

experimento con 4 tratamientos SuAr, SuAb, InAr y InAb, y que se combinan con la

utilización o no del coadyuvante en la solución de rociado.

El experimento resultante es un trifactorial, con un factor principal (coadyuvante)

asociado a parcelas principales (sitios donde se realiza el rociado) y dos factores (altura

y ubicación de cara sensible de la tarjeta) asociados a las subparcelas (tarjetas dentro de

sitio). El archivo conteniendo los datos se llama Cobertura de gotas.IDB2 y el

encabezamiento de la tabla de datos se presenta en la Figura 52.

http://dl.dropbox.com/u/65302225/Datos/Cobertura%20de%20gotas.IDB2�


72

Figura 52: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2.

En la tabla de datos hay una columna que identifica a la parcela y va numerada de 1 a

16. Este va a ser el único efecto aleatorio de nuestro modelo.

El modelo lineal para las observaciones de este experimento es el siguiente:

;

1,.., 2; 1,..., 2; 1,..., 2; 1,...,16ijkl i j k ij ik jk ijk l ijkly b

i j k lµ τ γ η δ ϕ λ θ ε= + + + + + + + + +

= = = = (8)

donde ijkly representa la respuesta observada en i-ésimo nivel del factor coadyuvante y

j-ésimo nivel de factor altura, k-ésimo nivel del factor cara en la l-ésima parcela, µ

representa la media general de la respuesta, iτ representa el efecto del i-ésimo nivel del

factor asociado a las parcelas principales (coadyuvante), jγ representa el efecto del

j-ésimo nivel del factor altura, kη el k-ésimo nivel del factor cara, ambos asociados a

las subparcelas y ijδ , ikϕ , jkλ y ijkθ las interacciones de segundo y tercer orden

correspondientes de los factores coadyuvante, altura y cara. Por otra parte lp y ijklε

representan los efectos aleatorios de las parcelas y de los errores experimentales

respectivamente. Las suposiciones sobre estos componentes aleatorios son que

( )2~ 0,l pp N σ , que ( )2~ 0,ijkl N εε σ , y que estas dos componentes aleatorias son

independientes.

A continuación presentamos la forma en que se especifica el modelo anterior en

InfoStat, su salida, interpretación y algunas acciones complementarias de validación del

modelo. Para ello invocaremos el Menú: Modelos lineales generales y

mixtos>>Estimación. El diálogo de selección de variables para este caso se presenta en

la Figura 53.


73

Figura 53: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Cobertura de gotas.IDB2.

La especificación de la parte fija del modelo para este ejemplo contiene los tres factores

y sus interacciones dobles y triples (Figura 54).

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2.

El efecto aleatorio que consideramos en este ejemplo es el de Parcela (Figura 55).


74

Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2 con Parcela como criterio de estratificación.

Luego de aceptar las especificaciones anteriores obtendremos la siguiente salida:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Cobertura_REML<-lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coad:Altura:Cara ,random=list(Parcela=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_Cobertura_REML Variable dependiente:Cobertura Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 64 670.38 690.63 -325.19 65.17 0.76 0.82 AIC y BIC menores implica mejor


75

Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 42 233.37 <0.0001 Coad 1 14 1.89 0.1909 Altura 1 42 72.86 <0.0001 Cara 1 42 95.32 <0.0001 Coad:Altura 1 42 1.58 0.2152 Coad:Cara 1 42 0.01 0.9271 Altura:Cara 1 42 34.77 <0.0001 Coad:Altura:Cara 1 42 0.21 0.6476 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Parcela Desvíos estándares relativos al residual y correlaciones (Intercept) (Intercept) 0.40

Una revisión de los residuos estandarizados de este modelo mediante las herramientas

de diagnóstico en el Menú: Modelos lineales generales y mixtos>>Análisis-exploración

de modelos estimados muestra una posible heterogeneidad de varianzas cuando se

comparan las observaciones obtenidas cuando la cara sensible de la tarjeta hidrosensible

se presenta hacia arriba o hacia abajo (Figura 56).

Figura 56: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara. Archivo Cobertura de gotas.IDB2.


76

Para tener en cuenta la posible falta de homogeneidad de varianzas entre posiciones de

la cara sensible, invocaremos nuevamente el menú de estimación del modelo. Todas las

especificaciones anteriores se han preservado por lo que sólo tenemos que

concentrarnos en la especificación de la función varianza. Para ello utilizaremos la

solapa heteroscedasticidad como se muestra en la Figura 57.

Figura 57: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2 con Cara como criterio de agrupamiento.

La salida resultante es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_Cobertura_REML<-lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coad:Altura:Cara ,random=list(Parcela=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|Cara)) ,method="REML" ,na.action=na.omit


77

,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_Cobertura_REML Variable dependiente:Cobertura Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 64 636.54 658.82 -307.27 21.26 0.76 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 42 176.66 <0.0001 Coad 1 14 4.19 0.0599 Altura 1 42 53.72 <0.0001 Cara 1 42 98.43 <0.0001 Coad:Altura 1 42 13.83 0.0006 Coad:Cara 1 42 0.01 0.9259 Altura:Cara 1 42 35.90 <0.0001 Coad:Altura:Cara 1 42 0.22 0.6423 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Parcela Desvíos estándares relativos al residual y correlaciones DS(Const) DS(Const) 1.06 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Cara Parámetros del modelo Parámetro Estim Ab 1.00 Ar 4.15

El modelo para estos datos sería ijkl i jk l ijkly pµ ε= + + , donde i jkµ representa el efecto

fijo de i-ésimo tratamiento en la j-ésima cara (cara puede ser Ab o Ar), lb es el efecto

aleatorio de la k-esima parcela experimental que se supone ( )20, pN σ y ( )2~ 0,ijkl kNε σ .

Luego la varianza de una observación tomada en una parcela seleccionada

aleatoriamente va a depender si se hace en la cara de abajo o arriba de la tarjeta. Así si


78

tomamos una observación de la cara de abajo la varianza va a ser (21.26*1.06)2 +

(21.26*1)2 y si la tomamos en la cara de arriba: (21.26*1.06)2 + (21.26*4.15)2.

A continuación se presentan las medidas resumen del modelo homoscedástico y del

heteroscedástico.

Medidas de ajuste del modelo homoscedástico N AIC BIC logLik Sigma R2_0 R2_1 64 670.38 690.63 -325.19 65.17 0.76 0.82 AIC y BIC menores implica mejor Medidas de ajuste del modelo heteroscedástico N AIC BIC logLik Sigma R2_0 R2_1 64 636.54 658.82 -307.27 21.26 0.76 0.81 AIC y BIC menores implica mejor

Si comparamos los AIC y BIC veremos que el último modelo ajustado es mejor y por lo

tanto la interpretación de la pruebas de hipótesis debe basarse en este último.

Obsérvese que en la estructura de varianzas, la desviación estándar residual de las

observaciones en las tarjetas que apuntan hacia arriba es 4.15 veces mayor que la

desviación estándar residual de las observaciones en las tarjetas que apuntan hacia

abajo.

Por otra parte, observando los resultados de las pruebas de hipótesis resulta que la

interacción Coad:Altura:Cara no resultó significativa, por lo que se pueden observar

las interacciones dobles (Figura 58). Entre estas, Coad:Altura y Altura:Cara son

significativas. Estas interacciones se analizan utilizando la solapa Comparaciones de la

ventana Modelos lineales generales y mixtos y tildando las correspondientes

interacciones en la lista de términos del modelo que se presenta en esa ventana. Este

procedimiento creará una tabla con las medias de todas las combinaciones resultantes de

los niveles de los factores que intervienen en la interacción. El resultado, al final de la

salida, presenta las siguientes tablas.

Medidas ajustadas y errores estándares para Coad*Altura LSD Fisher (alfa=0,05) Procedimiento de corrección de p-valores: No Coad Altura Medias E.E. Si Su 253.94 17.89 A No Su 204.69 17.89 A Si In 94.38 17.89 B No In 86.13 17.89 B Medias con una letra común no son significativamente diferentes (p<= 0.05)


79

Medidas ajustadas y errores estándares para Altura*Cara LSD Fisher (alfa=0,05) Procedimiento de corrección de p-valores: No Altura Cara Medias E.E. Su Ar 356.88 22.74 A In Ar 121.75 22.74 B Su Ab 101.75 7.73 B In Ab 58.75 7.73 C Medias con una letra común no son significativamente diferentes (p<= 0.05)

a) b)

Figura 58: Diagramas de puntos para estudiar la interacción entre Coad y Altura (a) y entre Cara y Altura (b).

Parcelas subdivididas (split-split plot)

Este diseño utiliza el mismo principio que las parcelas divididas, excepto que lo

extiende un paso más. El principio puede extenderse arbitrariamente a niveles más

profundos de división. El modelo lineal para este diseño, suponiendo las parcelas

principales agrupadas en bloques completos aleatorizados, es el siguiente:

ijkl i j k ij ik jk ijk l il jil ijkly b p spµ α β χ δ φ γ η ε= + + + + + + + + + + + (9)

En la expresión anterior µ representa la media general, iα el i-ésimo nivel del factor

asociado a las parcelas principales, jβ el j-ésimo nivel del factor asociado a las

subparcelas dentro de las parcelas principales, kχ el k-ésimo nivel del factor asociado a

las sub-subparcelas (dentro de las subparcelas) y ijδ , ikφ , jkγ y ijkη las correspondientes

Sin coadyuvante Con coadyuvante

Superior InferiorAltura

0

50

100

150

200

250

300

Cob

ertu

ra

Sin coadyuvante Con coadyuvante Cara abajo Cara arriba

Superior InferiorAltura

0

100

200

300

400

Cob

ertu

ra

Cara abajo Cara arriba


80

interacciones. Los términos aleatorios de este modelo corresponden a los efectos de

bloques, ( )2~ 0,l bb N σ , los efectos de parcelas, ( )2~ 0,il pp N σ , los efectos de

subparcelas, ( )2~ 0,jil spsp N σ y el error experimental, ( )2~ 0,ijkl N εε σ . Todos ellos,

como siempre, se suponen independientes.

Consideremos ahora un ejemplo. Los datos están en el archivo Calidad del

almidón.IDB2 (Di Rienzo 2007). En este experimento se evalúa el índice de absorción

de agua (IAA) del almidón cocido y crudo obtenido de dos genotipos de Quínoa

cultivada bajo 4 niveles de fertilización nitrogenada. Las variedades son Faro y

UDEC10. Éstas se asignaron a grandes parcelas dispuestas en 3 bloques. Las parcelas

en las que fueron sembradas las variedades fueron divididas en 4 subparcelas a las que

se les asignaron 4 dosis de fertilización: 0, 75, 150 y 225 kg/ha. Las subparcelas fueron

nuevamente divididas en 2 para asignar el tratamiento de cocción o sin cocción (crudo).

El esquema para este diseño de experimento se presenta en la Figura 59.

Figura 59: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del almidón.IDB2.

Para el análisis de este diseño mediante un modelo mixto, además de la especificación

de la parte fija, como en un clásico experimento tri-factorial, sólo debemos especificar

la parte aleatoria para incluir el efecto aleatorio de los Bloques, de las Parcelas

Bloque 1

Bloque 2

Bloque 3

Sub-sub Parcela

Sub-Parcela

Parcela principal

http://dl.dropbox.com/u/65302225/Datos/Calidad%20del%20almidon.IDB2�



81

Principales dentro de Bloques y de las Subparcela dentro de Parcelas. El

encabezamiento del archivo Calidad del Almidón.IDB2 se presenta en la Figura 60.

Figura 60: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2.

La ventana de selección de variables para este ejemplo tendrá que contener la

información que se presenta en la Figura 61.

Figura 61: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Calidad del Almidón.IDB2.

La especificación de la parte fija deberá contener los factores e interacciones

presentados en la Figura 62.



82

Figura 62: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidón.IDB2.

La parte aleatoria deberá tener declarados a los bloques (Bloque), a las parcelas

principales dentro de Bloques (Genotipo) y a las subparcelas dentro de parcelas

principales (Nitrógeno) (Figura 63).


83

Figura 63: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2.

La salida correspondiente es la siguiente:

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_IAA_REML<-lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Coccion+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion ,random=list(Bloque=pdIdent(~1) ,Genotipo=pdIdent(~1) ,Nitrogeno=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo000_IAA_REML Variable dependiente:IAA


84

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 16 1389.20 <0.0001 Genotipo 1 2 14.49 0.0626 Nitrogeno 3 12 0.78 0.5287 Coccion 1 16 32.90 <0.0001 Genotipo:Nitrogeno 3 12 0.88 0.4769 Genotipo:Coccion 1 16 37.67 <0.0001 Nitrogeno:Coccion 3 16 1.74 0.1998 Genotipo:Nitrogeno:Coccion.. 3 16 0.46 0.7108 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.3E-05 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Genotipo dentro de Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 5.0E-06 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Nitrogeno dentro de Genotipo dentro de Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.8E-05

Podríamos seguir realizando pruebas de diagnóstico pero asumiremos que el modelo es

correcto. La interpretación de las pruebas de hipótesis indica que sólo la interacción

Genotipo:Cocción es significativa. Las comparaciones múltiples para las medias de

tratamientos correspondientes a esta interacción se presentan a continuación. En estas

pruebas se observa que sólo el almidón cocido del genotipo UDEC10 presenta un IAA

significativamente mayor que el resto de combinaciones de Genotipo y Cocción.


85

Medidas ajustadas y errores estándares para Genotipo*Coccion LSD Fisher (alfa=0,05) Genotipo Coccion Medias E.E. UDEC10 Cocido 4.64 0.18 A Faro Crudo 2.97 0.18 B Faro Cocido 2.90 0.18 B UDEC10 Crudo 2.56 0.18 B

Medias con una letra común no son significativamente diferentes (p<= 0.05)

Una manera alternativa de formular el modelo anterior consiste en dejar los efectos fijos

como en la Figura 62 y especificar los efectos aleatorios como se muestra en la Figura

64. Los resultados son exactamente los mismos que antes, excepto por el cálculo de los

grados de libertad del denominador y por ende los valores de probabilidad. Esta es una

aproximación también válida aunque la versión anterior es acorde con el análisis

tradicional basado en efectos fijos. Además, las estimaciones de varianza están

presentadas en forma diferente.

Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2 que contempla otra forma de especificar la parte aleatoria.


86

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_IAA_REML<-lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Coccion+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion ,random=list(Bloque=pdIdent(~1) ,Bloque=pdIdent(~Genotipo-1) ,Bloque=pdIdent(~Genotipo:Nitrogeno-1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_IAA_REML Variable dependiente:IAA Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 30 1389.20 <0.0001 Genotipo 1 30 14.49 0.0006 Nitrogeno 3 30 0.78 0.5157 Coccion 1 30 32.90 <0.0001 Genotipo:Nitrogeno 3 30 0.88 0.4605 Genotipo:Coccion 1 30 37.67 <0.0001 Nitrogeno:Coccion 3 30 1.74 0.1807 Genotipo:Nitrogeno:Coccion.. 3 30 0.46 0.7089 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Const) (Const) 1.3E-05 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Genotipo - 1|Bloque Desvíos estándares relativos al residual y correlaciones Faro UDEC10 Faro 5.0E-06 0.00 UDEC10 0.00 5.0E-06


87

Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Genotipo:Nitrogeno - 1|Bloque Desvíos estándares relativos al residual y correlaciones Faro:0 UDEC10:0 Faro:75 UDEC10:75 Faro:150 UDEC10:150 Faro:225 UDEC10:225 Faro:0 1.8E-05 0 0 0 0 0 0 0 UDEC10:0 0 1.8E-05 0 0 0 0 0 0 Faro:75 0 0 1.8E-05 0 0 0 0 0 UDEC10:75 0 0 0 1.8E-05 0 0 0 0 Faro:150 0 0 0 0 1.8E-05 0 0 0 UDEC10:150 0 0 0 0 0 1.8E-05 0 0 Faro:225 0 0 0 0 0 0 1.8E-05 0 UDEC10:225 0 0 0 0 0 0 0 1.8E-05


88

Aplicación de modelos mixtos para mediciones repetidas en el tiempo

Datos longitudinales

Para la modelación de datos longitudinales el aspecto más importante a considerar es la

estructura de la matriz de covarianza residual, que es posible modelar especificando la

matriz de correlación. En algunos casos también las varianzas pueden ser distintas para

algún criterio de agrupamiento y se debe modelar la heteroscedasticidad. Recordemos

que existe correlación residual entre observaciones que comparten el mismo valor del

criterio de estratificación, conocido también como sujeto, (por ejemplo, tomadas sobre

la misma persona, la misma parcela, el mismo animal, el mismo árbol, etc.). Así, la

matriz de covarianza residual para todas las observaciones será una matriz diagonal por

bloques, y en cada bloque se reflejará la estructura deseada, i.e. simetría compuesta,

autorregresiva de orden 1, etc.

Para especificar esto, InfoStat presenta dos solapas. En la solapa Correlación se

encuentran las opciones que permiten especificar la estructura de correlación de los

errores y en la solapa Heteroscedasticidad se pueden seleccionar distintos modelos de

varianza. Así, las distintas estructuras de la matriz de covarianza residual que se pueden

ajustar resultan de combinar las distintas estructuras de correlación con la posible

heteroscedasticidad en el tiempo. Si adicionalmente se desea especificar un efecto

aleatorio también es posible hacerlo usando la solapa correspondiente. En este caso se

debe tener mucha precaución de no combinar efectos aleatorios, estructuras de

correlación y de heteroscedasticidad tales que el modelo final no sea identificable. Esto

sucede cuando existe un conjunto infinito de valores de los parámetros para los cuales el

modelo es indistinguible, y por lo tanto las soluciones a las ecuaciones de verosimilitud

no son únicas.

Ejemplos de estas situaciones ocurren cuando se especifica una estructura de

correlación de simetría compuesta con un criterio de estratificación (por ejemplo, la

parcela) y un efecto aleatorio de ese mismo criterio de estratificación sobre la constante.

En este caso la estructura de covarianza de las observaciones será una matriz diagonal

por bloques, y cada bloque tendrá una estructura de simetría compuesta. Por lo tanto,

esta estructura tiene intrínsecamente dos parámetros. Pero de la manera que la hemos

especificado aparecen tres parámetros (varianza del efecto aleatorio, correlación


89

intraclase de la estructura de correlación residual y varianza residual). Esta

sobreparametrización hace que existan infinitas soluciones, y por lo tanto los

estimadores no se pueden interpretar (y en muchos casos el algoritmo numérico no

converge). Otra situación común es la de una correlación sin estructura (corSymm) con

un criterio de estratificación dado (por ejemplo la parcela) y un efecto aleatorio de ese

mismo criterio de estratificación sobre la constante (intercept).

Análisis de un ensayo de establecimiento de forrajeras

A continuación se presenta un ejemplo de modelación de observaciones repetidas en el

tiempo. Los datos provienen de un ensayo de establecimiento de forrajeras para

comparar cinco métodos de labranza (T1 = labranza mínima, T2 = labranza mínima con

herbicida, T3 = labranza mínima con herbicida y arado de disco a los 45 días,

T4 = labranza cero, y T5 = labranza convencional) en la región central húmeda de

Puerto Rico. La especie usada fue Brachiaria decumbens cv. Basilik. El experimento

estaba diseñado en tres bloques completos aleatorizados, y se analizan aquí las medidas

de cobertura (porcentaje de cobertura estimado en cada parcela). Hay 5 medidas

repetidas, tomadas con intervalos de un mes entre agosto y diciembre de 2001 (Moser y

Macchiavelli 2002). Los datos se encuentran en Cobertura forrajes.IDB2 en la carpeta

de datos de prueba de InfoStat.

Los perfiles promedio de cobertura observados en los cinco tiempos para cada uno de

los tratamientos se presentan en la Figura 65.

Figura 65: Relación entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2.

T1 T2 T3 T4 T5

1 2 3 4 5Tiempo

0

10

20

30

40

50

Cob

ertu

ra (%

)

T1 T2 T3 T4 T5

http://dl.dropbox.com/u/65302225/Datos/cobertura%20forrajes.IDB2�


90

Como estrategia general para analizar estos datos primero se ajustarán modelos con

distintas estructuras de covarianza, combinando apropiadamente estructuras de

correlación residual, heteroscedasticidad residual y efectos aleatorios. Mediante criterios

de verosimilitud penalizada (AIC y BIC) se elegirá el modelo que mejor describa los

datos, y usando este modelo se realizarán inferencias acerca de las medias (comparar

tratamientos, estudiar el efecto del tiempo, analizar si los perfiles promedio varían en el

tiempo, si son paralelos, etc.).

Para elegir el mejor modelo comenzaremos proponiendo un modelo sencillo con pocos

parámetros a estimar (i.e. parsimonioso), e iremos adicionando parámetros hasta llegar

al modelo sin estructura, que es el menos parsimonioso. Se usarán las siguientes

estructuras de covarianza para los datos (covarianza marginal):

1. Efecto aleatorio de bloque y errores independientes y homoscedásticos.

2. Efectos aleatorios de bloque y parcela dentro de cada bloque, errores independientes y homoscedásticos.

3. Efecto aleatorio de bloque y errores independientes y heteroscedásticos.

4. Efectos aleatorios de bloque y parcela dentro de cada bloque, errores independientes y heteroscedásticos.

5. Efectos aleatorios de bloque, correlación constante entre errores de la misma parcela y varianza residual constante en el tiempo (equivalente al modelo 2).

6. Efectos aleatorios de bloque, correlación constante entre errores de la misma parcela y varianza residual diferente en los distintos tiempos.

7. Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual constante en el tiempo.

8. Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual constante en el tiempo.

9. Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual diferente en los distintos tiempos.

10. Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual diferente en los distintos tiempos

11. Efectos aleatorios de bloque, sin estructura para las correlaciones entre errores provenientes de la misma parcela y varianzas residuales diferentes en el tiempo.

Para ajustar estos modelos en primer lugar se deben declarar las variables como se

indica en la Figura 66.


91

Figura 66: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del ejemplo Cobertura forrajes.IDB2.

En todos los casos se usó el mismo modelo de medias, ya que la parte fija del modelo

referido no cambió (imprescindible si se desea comparar estructuras de covarianza

usando REML, y por ende los criterios de AIC y BIC) (Figura 67). A continuación se

detallará la forma de declarar cada uno de los modelos a evaluar seguido por una salida

de InfoStat con las medidas de ajuste correspondientes.


92

Figura 67: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2.

Modelo 1: Efecto aleatorio de bloque, errores independientes y homoscedásticos.

En la solapa Efectos Aleatorios se debe seleccionar Bloque (Figura 68), y en la solapa

Correlación se debe declarar Errores independientes (Figura 69), que es la opción por

defecto, y en la solapa Heteroscedasticidad no se declara nada.


93

Figura 68: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de efectos aleatorios de Bloque.


94

Figura 69: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de Errores independientes (Modelo 1).

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 75 476.39 528.01 -211.19 12.19 0.56 0.63 AIC y BIC menores implica mejor

Modelo 2: Efectos aleatorios de bloque y parcela dentro de bloque, errores independientes y homoscedásticos.

En la solapa Efectos Aleatorios se debe seleccionar Bloque y Parcela (que queda por

defecto anidada dentro de bloque) (Figura 70), y en la solapa Correlación se debe

declarar Errores independientes, que es la opción por defecto, y en la solapa

Heteroscedasticidad no se declara nada (como en el modelo 1).


95

Figura 70: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de efectos aleatorios de Bloque y Parcela dentro de bloques.


Modelo 3: Efecto aleatorio de bloque, errores independientes y heteroscedásticos.

Las solapas Efectos aleatorios y Correlación se declaran como en el modelo 1 (Figura

68 y Figura 69), y en la solapa Heteroscedasticidad se declara varIdent y en criterio de

agrupamiento se declara Tiempo (Figura 71).


96

Figura 71: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2 con selección de función varIdent con tiempo como criterio de agrupamiento.


Modelo 4: Efectos aleatorios de bloque y parcela dentro de cada bloque, errores independientes y heteroscedásticos.

Las solapas Efectos aleatorios y Correlación se declaran como en el modelo 2 (Figura

70 y Figura 69 respectivamente), y la solapa Heteroscedasticidad se declara como en el

modelo 3 (Figura 71).



97

Modelo 5: Efecto aleatorio de bloque, correlación constante entre datos de la misma parcela y

varianza constante en el tiempo.

En la solapa Correlación se eligió la opción Simetría Compuesta. Se debe declarar

también el Criterio de agrupamiento, en este caso Parcela y Bloque para indicar que se

está modelando la correlación de datos provenientes de una misma parcela en un bloque

dado (Figura 72). En la solapa Heteroscedasticidad se dejó la opción por defecto, es

decir no se eligió ningún criterio (para esto ir a la solapa Heteroscedasticidad y borrar la

selección anterior desactivando todas las opciones y oprimiento Borrar en la última

caja).

Figura 72: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de Simetría compuesta para datos

agrupados por parcela.


98

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 75 470,00 523,54 -207,00 12,59 0,56 0,61 AIC y BIC menores implica mejor

Se debe observar que este modelo obtiene los mismos valores de ajuste (AIC, BIC, y

log verosimilitud) que el modelo 2, ya que ambos son esencialmente el mismo modelo

(excepto en el caso que la correlación constante dentro de una parcela sea negativa).

Observar que el modelo 2 incorpora la correlación entre datos de la misma parcela a

través del efecto aleatorio de parcela, mientras que el modelo 5 lo hace a través de la

estructura de correlación de simetría compuesta.

Debido a esto, no es posible intentar ajustar un modelo que incluya efecto aleatorio de

parcela dentro de bloques y simetría compuesta en el mismo nivel de agrupamiento: este

modelo no sería identificable, y sus estimadores no serían válidos (aunque a veces el

programa puede mostrar una salida, ésta no sería válida).

Modelo 6: Efecto aleatorio de bloque, correlación constante entre datos de la misma parcela y

varianza diferente en los distintos tiempos.

En la solapa Correlación se eligió la opción Simetría compuesta (Figura 72) y en la

solapa Heteroscedasticidad eligió la opción varIdent y en Criterios de agrupamiento se

declara Tiempo (Figura 71).


Modelo 7: Efecto aleatorio de bloque, estructura autorregresiva de orden 1 entre los errores

de la misma parcela y varianza residual constante en el tiempo.

En la solapa Efectos aleatorios se declaro a Bloque (como en Figura 68) y en la solapa

Correlación se eligió la opción Autorregresivo de orden 1 (Figura 74). Debido a que

este modelo tiene en cuenta el orden en que fueron tomadas las observaciones, la

variable que indica esto se debe declarar en la ventana correspondiente (en este caso la

variable Tiempo). Para incorporar esta variable, arrastrar Tiempo desde la ventana de la

derecha. Si los tiempos no fuesen equidistantes, la estructura corAR1 no es aplicable, y

se debe usar su análoga continua (corCAR1). Para este ejemplo ambas estructuras son

equivalentes debido a que los tiempos son equidistantes.


99

En la solapa Heteroscedasticidad se dejó la opción por defecto, es decir no se eligió

ningún criterio (para esto ir a la solapa Heteroscedasticidad y borrar la selección

anterior desactivando todas las opciones y oprimiendo Borrar).

Figura 73: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de modelo Autorregresivo de orden 1 para datos agrupados por Bloque y

Parcela y orden de las observaciones indicado por la variable Tiempo.



100

Modelo 8: Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura

autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual constante

en el tiempo.


Este modelo tiene un ajuste muy parecido al modelo anterior (modelo 7) ya que su

verosimilitud es similar. Sin embargo, si se aumenta el número de decimales se verá que

son un poco distintos. Lo mismo ocruirirá cuando se comparen los modelos 9 y 10.

Modelo 9: Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores

de la misma parcela y varianza residual diferente en los distintos tiempos.

En la solapa Correlación se eligió la opción Autorregresivo de orden 1. En la solapa

Heteroscedasticidad se eligió la opción varIdent y se especificó el criterio de

agrupamiento que en este caso es la variable tiempo.


Modelo 10: Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura

autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual diferente en

los distintos tiempos.


Modelo 11: Efectos aleatorios de bloque, sin estructura para las correlaciones entre errores

provenientes de la misma parcela y varianzas residuales diferentes en el tiempo.

En la solapa Correlación se eligió la opción Sin estructura (Figura 74) y en la solapa

Heteroscedasticidad se dejó tildada la opción varIdent.


101

Recordemos que mo es posible ajustar un modelo que incluya efecto aleatorio de

parcela y sin estructura en el mismo nivel de agrupamientos. El modelo en este caso

seria no identificable y su estimadores no son valiodos aunque el programa muester una

salida (lo mismo que ocurría con el modelo de simetría compuesta).

Figura 74: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de modelo Sin estructura para datos agrupados por parcela y orden de las

observaciones indicado por la variable Tiempo (Modelo 11).



102

Selección de la estructura de covarianza

Si comparamos los valores de AIC (o los de BIC) para las estructuras que hemos

ajustado, se puede observar que el menor valor se obtiene con el Modelo 11 (AIC =

434.74, BIC = 513.14), por lo tanto elegimos la covarianza sin estructura. Observemos

los parámetros estimados bajo este modelo:

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 75 434.7426 513.1355 -176.3713 6.4813 0.5611 0.5854 AIC y BIC menores implica mejor Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 0.3942 Estructura de correlación Modelo de correlación: General correlation Formula: ~ (as.integer(Tiempo)) | Bloque/Parcela 0 1 2 3 4 1.0000 0.2937 0.7012 0.1182 0.0953 0.2937 1.0000 0.2476 0.1535 0.1766 0.7012 0.2476 1.0000 0.4755 0.4718 0.1182 0.1535 0.4755 1.0000 0.9953 0.0953 0.1766 0.4718 0.9953 1.0000 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Tiempo Parámetros de la función de varianza Parámetro Estim 1 1.0000 2 1.2400 3 2.0278 4 2.5759 5 2.4614

Las varianzas residuales estimadas para cada uno de los 5 tiempos se calculan de la

siguiente manera:


103

( )( )( )( )

2 21

222

223

224

225

ˆ 6.4813 42.0072

ˆ 1.2400 6.4813 64.5903

ˆ 2.0278 6.4813 172.7327

ˆ 2.5759 6.4813 278.7291

ˆ 2.4614 6.4813 254.5005

σ

σ

σ

σ

σ

= =

= × =

= × =

= × =

= × =

Las 10 correlaciones residuales estimadas aparecen directamente como una matriz en

Estructura de Correlación. Para obtener una estimación de la varianza marginal (es

decir la varianza de una observación en un tiempo específico), se debe sumar a cada

varianza residual la varianza de bloque y de parcela dentro de bloque:

( )22ˆ 0.3942 6.4813 6.5277bloqueσ = × =

Inferencia sobre las medias

Una vez elegida la estructura de covarianza de los datos (en este caso el modelo sin

estructura) podemos proceder a realizar inferencias acerca de las medias. Los perfiles

promedios observados para cada tratamiento se presentaron en la Figura 65.

En un experimento factorial como este, donde se tiene el factor tratamiento y el factor

tiempo, lo primero que se debe indagar es si existe interacción entre los tratamientos y

el tiempo. Para ello podemos realizar una prueba de Wald, que aparece directamente en

InfoStat como Trat:Tiempo en las pruebas marginales o secuenciales (recordemos que

la interacción es el último término que colocamos en el modelo, por lo que ambas

pruebas en este caso son equivalentes). Otra opción es realizar una prueba del cociente

de verosimilitudes (LRT por sus siglas en inglés). Para esta última no podemos usar

REML debido a que estamos probando modelos con efectos fijos diferentes, y por lo

tanto los estimadores REML no son comparables. En su lugar se usa el estimador

máximo verosímil (ML).

Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 48 82.60 <0.0001 Tratam 4 48 4.05 0.0065 Tiempo 4 48 16.77 <0.0001 Tratam:Tiempo 16 48 1.49 0.1417


104

Para realizar una prueba de cociente de verosimilitudes podemos ajustar (con ML) dos

modelos con la misma estructura de covarianza (en este ejemplo el modelo sin

estructura) pero que difieren en su parte fija: uno contiene la interacción (modelo

completo) y el otro no la contiene (modelo reducido):

Modelo completo:


Modelo reducido:


Si bien la prueba LRT se puede obtener directamente desde el menú Análisis-

exploración de modelos estimados, solapa Modelos, a continuación se muestra otra

forma de calcularla. En primer lugar se obtiene el estadístico de la prueba LRT,

2 log lik 2log lik 2( 228.75) 2( 240.59) 23.68completo reducidoG = − = − − − = . Este tiene 42-

26=16 grados de libertad, y arroja un valor p=0.0967, por lo que podemos decir que no

existe interacción con un nivel de significancia del 5%. Este valor de probabilidad se

obtiene a partir de una distribución chi-cuadrado con 16 grados de libertad, y puede ser

calculado con la herramienta Calculador de probabilidades y cuantiles del menú

Estadísticas de InfoStat (Figura 75).


105

Figura 75: Ventana del Calculador de probabilidades y cuantiles de InfoStat.

Ambas pruebas (Wald y LRT) indican una interacción no significativa (aunque los

p-valores no son demasiado altos, p=0.1417 y p=0.0967 respectivamente), por lo que

podemos (con precaución) realizar pruebas de efectos de tratamiento y tiempo por

separado.

Contrastando tiempos sucesivos

Para comparar los tiempos sucesivos, es decir el tiempo 1 con el tiempo 2, el tiempo 2

con el tiempo 3 y así sucesivamente, se debe activar la solapa Comparaciones y dentro

de esta la subsolapa Contrastes y seleccionar el efecto Tiempo (Figura 76). El resto de

las ventanas debe quedar como en el Modelo 11, que fue elegido como el de mejor

estructura de correlación para explicar el comportamiento de estos datos en el tiempo.


106

Figura 76: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y selección de la subsolapa Contrastes.

Pruebas de hipótesis para contrastes Tiempo Contraste E.E. F gl(num) gl(den) p-valor Ct.1 -9.80 2.25 18.94 1 48 0.0001 Ct.2 -5.77 3.51 2.70 1 48 0.1070 Ct.3 1.76 4.02 0.19 1 48 0.6640 Ct.4 0.26 0.45 0.34 1 48 0.5645 Total 16.77 4 48 <0.0001

Las salidas presentadas aquí corresponden a las estimaciones REML. Está claro a partir

de estos resultados que, en promedio para los cuatro tratamientos, se ve un cambio

significativo entre los tiempos 1 y 2, pero en tiempos posteriores la cobertura promedio

no cambia significativamente. Las mismas conclusiones se obtienen realizando una

comparación de medias de cada tiempo (LSD):


107

Medias ajustadas y errores estándares para Tiempo LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Tiempo Medias E.E. 3 30.29 3.70 A 4 28.53 4.56 A 5 28.27 4.38 A 2 24.53 2.55 A 1 14.73 2.23 B

Medias con una letra común no son significativamente diferentes (p<= 0.05)

Comparación de tratamientos

Medias ajustadas y errores estándares para Tratam LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Tratam Medias E.E. 5 39.60 5.47 A 1 31.27 5.47 A B 4 24.96 5.47 A B C 3 17.33 5.47 B C 2 13.19 5.47 C Medias con una letra común no son significativamente diferentes (p<= 0.05)

A partir de esta comparación de medias ajustadas se puede concluir que los tratamientos

5, 1 y 4 son los que proveen mayor cobertura y no se diferencian significativamente

entre sí.


108

Análisis de un ensayo de drogas para asma

Una compañía farmacéutica ha examinado los efectos de dos drogas (A y B) sobre la

capacidad respiratoria de pacientes de asma (Littell et ál. 2002, 2006). Las dos drogas y

un placebo (P) fueron administradas a un grupo de pacientes en forma aleatoria. Se

contó con 24 pacientes por cada uno de los tres tratamientos. A cada paciente se le

midió la capacidad respiratoria basal (Cap_Rep_Bas) inmediatamente antes de aplicarle

el tratamiento y la capacidad respiratoria cada hora durante las 8 horas siguientes

(Cap_Respirat). Los datos están en el archivo CapacidadRespiratoria.IDB2.

Usando nuevamente la estrategia definida en los ejemplos anteriores, primero se

ajustarán modelos con distintas estructuras de covarianza, combinando apropiadamente

estructuras de correlación residual, heteroscedasticidad residual y efectos aleatorios.

Mediante criterios de verosimilitud penalizada (AIC y BIC) y pruebas de cociente de

verosimilitud se elegirá el modelo que mejor describa los datos. Una vez seleccionado el

modelo de estructura de covarianza adecuado se realizarán inferencias acerca de las

medias (comparar medias de drogas, estudiar el efecto del tiempo, analizar si los

perfiles promedio varían en el tiempo, si son paralelos, etc.). Es importante destacar que

toda la inferencia sobre las medias estará basada en el modelo de estructura de

covarianza seleccionado.

Debido a que la variable que identifica al paciente (Paciente) en la base de datos toma

valores iguales dentro de cada droga, para identificar a los 72 pacientes de este estudio

se ha debido crear una nueva variable (paciente_droga) que identifica completamente al

paciente. Para hacer esto se ha usado el menú Datos, submenú Cruzar categorías para

formar una nueva variable (seleccionado Paciente y Droga en la ventana del selector de

variables). Este es un experimento bifactorial y se usa un modelo que contempla los

factores Droga, Hora y su interacción y la covariable Cap_Rep_Bas (todos de efectos

fijos). Para realizar el análisis de este modelo, se deben declarar las variables de la

siguiente forma (Figura 77).

http://dl.dropbox.com/u/65302225/Datos/CapacidadRespiratoria.IDB2�


109

Figura 77: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2.

En primer lugar se evaluará un conjunto de modelos para determinar cuál es el que

mejor ajusta. Los modelos evaluados son:

1. Errores independientes y varianzas residuales homoscedásticas.

2. Simetría compuesta y varianzas residuales homoscedásticas.

3. Auto regresivo de orden 1 y varianzas residuales homoscedásticas.

4. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas.

5. Auto regresivo de orden 1 y varianzas residuales homoscedásticas y efecto aleatorio de paciente.

6. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas y efecto aleatorio de paciente.

7. Matriz de varianzas y covarianzas sin estructura y varianzas residuales heteroscedásticas.

La especificación de la parte fija del modelo es la misma para los 7 modelos evaluados

(Figura 78). Para obtener el ajuste del Modelo 1 solo se debe activar el botón Aceptar

con el modelo de efectos fijos presentado a continuación:


110

Figura 78: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2.

Para ajustar el Modelo 2, se deben especificar las ventanas como en la Figura 78 y la

Figura 79. El Modelo 3 se especifica como en la Figura 78 y la Figura 80. El Modelo 4

se especifica como el anterior más el agregado de varianzas residuales heterogéneas

como en la Figura 81. El Modelo 5 se especifica con las ventanas presentadas en la

Figura 78, la Figura 80 y la Figura 82. El Modelo 6 es como el Modelo 5 más la

especificacion de varianzas residuales heterogéneas (Figura 81). El modelo 7 se

especifica como se muestra en la Figura 78, Figura 81 y Figura 83).


111

Figura 79: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos del archivo CapacidadRespiratoria.IDB2.


112

Figura 80: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los datos del archivo CapacidadRespiratoria.IDB2.


113

Figura 81: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo CapacidadRespiratoria.IDB2.


114

Figura 82: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo CapacidadRespiratoria.IDB2.


115

Figura 83: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del archivo CapacidadRespiratoria.IDB2.

Luego de ajustar todos los modelos estos son los resultados:

Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo CapacidadRespiratoria.IDB2.

Modelo Efecto

aleatorio paciente

Correlación residual

Varianzas residuales

heterogéneas en el tiempo

AIC BIC log lik

1 NO NO NO 968.94 1081.04 -458.47

2 NO Simetría Compuesta NO 401.29 517.71 -173.65

3 NO AR1 NO 329.04 445.45 -137.52

4 NO AR1 SÍ 324.57 471.17 -128.28

5 SÍ AR1 NO 303.03 423.76 -123.52

6 SÍ AR1 SÍ 287.80 438.71 -108.90

7 NO Sin estructura SÍ 270.27 533.29 -74.14


116

A partir del Cuadro 2 podemos observar que los modelos 6 y 7 presentan los valores

más bajos de AIC mientras que los modelos 5 y 6 presentan los valores más bajos para

BIC. Una prueba formal de cociente de verosimilitud para comparar los modelos 5 y 6

puede obtenerse mediante:

2 2(log lik modelo reducido - log lik modelo completo)

2( 123.52 108.90) 29.24X = −

= − − + =

Como ambos modelos difieren en 7 parámetros (el Modelo 5 tiene una única varianza

residual y el Modelo 6 tiene 8 varianzas residuales), el estadístico de verosimilitud se

compara con un valor crítico de una distribución chi-cuadrado con 7 grados de libertad.

Al hacer esto con el calculador de probabilidades y cuantiles de InfoStat obtenemos un

p-valor de 0.0001, lo que nos lleva a escoger el modelo completo (Modelo 6).

La misma prueba se puede realizar con el menú Estadísticas>>Modelos lineales

generales y mixtos>> Análisis-exploración de modelos estimados. Para comparar ambos

modelos seleccionamos la solapa Modelos y obtenemos los siguientes resultados:

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 5 28 303.03 423.76 -123.52 6 35 287.80 438.71 -108.90 1 vs 2 29.23 0.0001

Los resultados de la prueba del cociente de verosimilitud indican que entre estos dos

modelos el mejor es el Modelo 6. Luego, resta solo comparar el Modelo 6 con el 7. En

este caso el modelo reducido es el 6 y el completo es el 7. Los resultados para esta

comparación son:

Comparación de modelos Model df AIC BIC logLik Test L.Ratio p-value 7 61 270.27 533.29 -74.14 6 35 287.80 438.71 -108.90 1 vs 2 69.53 <0.0001

Los resultados indican que el Modelo 7 es el mejor. Por lo tanto el modelo seleccionado

tiene una estructura de correlación residual sin estructura y varianzas residuales

heterogéneas en el tiempo. La salida completa para este modelo se presenta a

continuación:


117

Modelos lineales generales y mixtos Especificación del modelo en R modelo007_Cap_Respirat_REML<-gls(Cap_Respirat~1+Droga+Hora+Droga:Hora+Cap_Resp_base ,weight=varComb(varIdent(form=~1|Hora)) ,correlation=corSymm(form=~as.integer(as.character(Hora))|Paciente_Droga) ,method="REML" ,na.action=na.omit ,data=R.data09) Resultados para el modelo: modelo007_Cap_Respirat_REML Variable dependiente:Cap_Respirat Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 576 270.27 533.29 -74.14 0.48 0.55 AIC y BIC menores implica mejor Pruebas de hipótesis marginales(SC tipo III) numDF F-value p-value (Intercept) 1 6.49 0.0111 Droga 2 7.25 0.0008 Hora 7 13.72 <0.0001 Cap_Resp_base 1 92.57 <0.0001 Droga:Hora 14 4.06 <0.0001 Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3936.01 <0.0001 Droga 2 13.87 <0.0001 Hora 7 13.72 <0.0001 Cap_Resp_base 1 92.57 <0.0001 Droga:Hora 14 4.06 <0.0001 Estructura de correlación Modelo de correlación: General correlation Formula: ~ as.integer(as.character(Hora)) | Paciente_Droga Matriz de correlación común 1 2 3 4 5 6 7 8 1 1.00 0.89 0.88 0.78 0.69 0.67 0.52 0.65 2 0.89 1.00 0.91 0.87 0.81 0.70 0.59 0.70 3 0.88 0.91 1.00 0.91 0.81 0.75 0.64 0.74 4 0.78 0.87 0.91 1.00 0.82 0.73 0.67 0.75 5 0.69 0.81 0.81 0.82 1.00 0.85 0.73 0.84 6 0.67 0.70 0.75 0.73 0.85 1.00 0.81 0.88 7 0.52 0.59 0.64 0.67 0.73 0.81 1.00 0.82 8 0.65 0.70 0.74 0.75 0.84 0.88 0.82 1.00


118

Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Hora Parámetros de la función de varianza Parámetro Estim 1 1.00 2 1.07 3 1.06 4 1.15 5 1.12 6 1.07 7 1.09 8 1.15 Medias ajustadas y errores estándares para Droga LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Droga Medias E.E. B 3.33 0.09 A A 3.11 0.09 A P 2.82 0.09 B Medias con una letra común no son significativamente diferentes (p<= 0.05) Medias ajustadas y errores estándares para Hora LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hora Medias E.E. 1 3.33 0.06 A 2 3.30 0.06 A 3 3.22 0.06 B 4 3.12 0.06 C 5 3.02 0.06 D 6 2.96 0.06 D 7 2.88 0.06 E 8 2.87 0.06 E Medias con una letra común no son significativamente diferentes (p<= 0.05) Medias ajustadas y errores estándares para Droga*Hora LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Droga Hora Medias E.E. B 1 3.69 0.10 A B 2 3.63 0.10 A B B 3 3.58 0.10 A B A 1 3.47 0.10 A B C B 4 3.44 0.11 B C D A 2 3.39 0.10 B C D B 5 3.25 0.11 C D E A 3 3.18 0.10 D E F B 6 3.08 0.10 E F G A 5 3.05 0.11 E F G H


119

A 4 3.04 0.11 E F G H B 8 3.01 0.11 E F G H I A 6 2.98 0.10 E F G H I B 7 2.98 0.11 F G H I P 3 2.90 0.10 F G H I P 2 2.89 0.10 G H I P 4 2.87 0.11 G H I A 7 2.87 0.11 G H I A 8 2.86 0.11 G H I P 1 2.83 0.10 G H I P 6 2.82 0.10 G H I P 7 2.79 0.11 H I P 5 2.77 0.11 H I P 8 2.73 0.11 I Medias con una letra común no son significativamente diferentes (p<= 0.05)

Podemos ver que hay interacción significativa entre la droga y el tiempo (p<0.0001),

por lo que procederemos a realizar un Gráfico de interacción. Para realizar este gráfico

en primer lugar se copiaron las Medias ajustadas y errores estándares para

Droga*Hora y se pegaron en una nueva tabla de InfoStat. Esta tabla fue guardada como

MedCapRes.IDB2. Luego en el menú Gráficos>>Gráficos de puntos se declararon las

variables como se muestra a continuación (Figura 84 y Figura 85):

Figura 84: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2.

http://dl.dropbox.com/u/65302225/Datos/MedCapRes.IDB2�


120

Figura 85: Ventana de selector de variables con solapa Particiones activada para los datos del archivo MedCapRes.IDB2.

Es importante recalcar que debido a que los errores estándar de cada una de las

combinaciones de tratamientos y horas son diferentes éstos deben ser tenidos en cuenta

al momento de solicitar el gráfico. Esto se logra declarando la medida de error en la

subventana Error. Con estas especificaciones se obtiene el gráfico para estudiar la

interacción (Figura 86).


121

Figura 86: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del archivo CapacidadRespiratoria.IDB2.

Podemos observar que mientras el placebo tiene una respuesta prácticamente constante,

las drogas A y B aumentan la capacidad respiratoria después de su aplicación. Esta

capacidad va disminuyendo con el tiempo, y siempre es superior el valor medio de la

droga B respecto a la droga A. Para encontrar diferencias significativas entre los

tratamientos en cada una de las horas se pueden realizar contrastes. En este caso, dentro

de cada hora se pueden probar hipótesis sobre igualdad de medias entre drogas y

placebo, y entre las dos drogas. Para la obtención de los contrastes (en este caso

ortogonales) se deben declara en la solapa Comparaciones, subsolapa Contrastes como

en la Figura 87.

Droga ADroga BPlacebo

1 2 3 4 5 6 7 8Hora

2.60

2.70

2.80

2.90

3.00

3.10

3.20

3.30

3.40

3.50

3.60

3.70

3.80

Cap

acid

ad re

spira

toria

med

iaDroga ADroga BPlacebo


122

Figura 87: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo CapacidadRespiratoria.IDB2.

A continuación se presentan lo valores de probabilidad para los contrastes solicitados: Pruebas de hipótesis para contrastes Droga*Hora F gl(num) gl(den) p-valor Ct.1 40.08 1 551 <0.0001 Ct.2 2.54 1 551 0.1119 Ct.3 23.46 1 551 <0.0001 Ct.4 2.46 1 551 0.1170 Ct.5 14.55 1 551 0.0002 Ct.6 7.36 1 551 0.0069 Ct.7 7.39 1 551 0.0068 Ct.8 6.37 1 551 0.0119 Ct.9 8.11 1 551 0.0046 Ct.10 1.63 1 551 0.2022 Ct.11 2.86 1 551 0.0914 Ct.12 0.53 1 551 0.4651 Ct.13 1.09 1 551 0.2965 Ct.14 0.53 1 551 0.4656 Ct.15 2.13 1 551 0.1446 Ct.16 0.94 1 551 0.3319 Total 5.19 16 551 <0.0001


123

Los Contrastes 1, 3, 5, 7 y 9 comparan el placebo con el promedio de las drogas para las

horas 1, 2, 3 ,4 y 5 respectivamente. Debido a que todos estos son significativos

(p<0.05) podemos decir que recién a la hora 6 de aplicadas las drogas estas pierden su

efecto, ya que los contrastes 11, 13 y 15 no son significativos. Respecto a la

comparación de las drogas entres sí, la superioridad de la B sobre la A se manifiesta

(p<0.05) solo en las horas 3 y 4 (contrastes 6 y 8 respectivamente).


124

Análisis de ensayo de descomposición

En los ensayos de descomposición de hojarasca la materia seca remanente en cada

tiempo es analizada, generalmente, mediante ANCOVA, usando el tiempo como

covariable y transformación logarítmica de la respuesta, o ANOVA para un diseño en

parcelas divididas, cuando los periodos de evaluación son equi-distantes. Las unidades

de observación consisten en bolsas conteniendo el material vegetal. Usualmente estas

bolsas son agrupadas para conformar una repetición y permitir su evaluación a lo largo

del tiempo, evaluando el contenido de una bolsa en cada instancia de valoración.

Aunque en cada tiempo las bolsas evaluadas son distintas, en muchas ocasiones la

estructura de correlación que supone independencia o simetría compuesta (inducida por

la agrupación de bolsas que representan una repetición) no es suficiente para explicar

las correlaciones observadas. Las observaciones cercanas en el tiempo suelen estar más

correlacionadas que las lejanas, o las correlaciones entre observaciones en los primeros

tiempos son diferentes a las de los últimos. El uso de modelos mixtos permite no sólo

manejar estructuras de correlación más complejas sino también la posibilidad de

modelar varianzas heterogéneas. En estos modelos los tratamientos pueden ser incluidos

como factores de clasificación y el tiempo puede modelarse tanto como una covariable

o como un factor. Este último caso produce modelos menos parsimoniosos pero más

flexibles para modelar diferentes tendencias en el tiempo. Por otra parte, la introducción

de efectos aleatorios sobre los parámetros que involucran al tiempo puede ser usada

para corregir falta de ajuste.

En el ejemplo, que se presenta a continuación, se analizan un conjunto de datos

proveniente de un ensayo de descomposición realizado en ambiente acuático tropical

(Martinez 2006). Los tratamientos comparados consisten en: dos especies (Guadua sp. y

Ficus sp.) de las cuales se obtiene el material vegetal y dos tamaño de la trama de la

bolsa donde se coloca el material (tramado fino y grueso). Los cuatro tratamientos

contaron con 5 repeticiones (conteniendo 7 bolsas cada una) y fueron evaluados en 7

tiempos. El propósito de este ensayo fue establecer el efecto de los factores y el tiempo

sobre la tasa de descomposición. Los datos se encuentran en el archivo

Descomposicion.IDB2.

Los datos originales (materia seca remanente) fueron transformados a logaritmos. El

gráfico del logaritmo de la materia seca remanente (en adelante la respuesta) en función

del tiempo y para cada tratamiento (Figura 88) muestra un decaimiento del peso seco

http://dl.dropbox.com/u/65302225/Datos/Descomposicion.IDB2�


125

remanente en función del tiempo. Se insinúa también una posible falta de

homoscedasticidad en función del tiempo y dependiente de la especie y el tramado de la

tela de la bolsa. Una primera aproximación a la modelación de estos datos podría ser el

ajuste de un modelo de regresión con ordenadas al origen y pendientes diferentes. Para

realizar este ajuste se invocó al módulo de modelos mixtos indicando como variable

dependiente al LnPesoSeco, como factores de clasificación a Especie y Bolsa y como

covariable al Tiempo. Luego en la solapa de la parte fija del modelo se indicaron los

términos que se presentan en la Figura 89. El gráfico del modelo ajustado se presenta en

la Figura 90.

Figura 88: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

0 10 20 30 40 50 60 70 80 90Tiempo

-4.0

-3.5

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

LnPe

soSe

co



126

Figura 89: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo para cuatro

tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.


127

Figura 90: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.

La Figura 90 muestra que el ajuste de rectas específicas por tratamiento, es una

aproximación que, aunque plausible, no da cuenta de algunas particularidades de la

pérdida de peso seco. Esto se refleja en la presencia de curvatura en los residuos (Figura

91). Una forma de resolver el problema de la presencia de curvatura es la imposición de

un modelo que incluya términos cuadráticos para el tiempo. Para ello tendremos que

extender el modelo propuesto en Figura 89, incluyendo todos los términos

correspondientes al tiempo al cuadrado. Para simplificar la notación hemos creado tres

variables T1 y T2 que representan el tiempo y el tiempo al cuadrado y Especie_Bolsa

que identifica los cuatro tratamientos. T1 es el tiempo centrado respecto del valor 30

(días) y T2 el cuadrado de T1. La razón para centrar las covariables es romper la

colinealidad que resulta de utilizar una regresora y su cuadrado y mejorar la condición

de la matriz X’X. Las variables T1 y T2 así como Especie_Bolsa se incluyen en el

archivo Descomposición.IDB2. En la invocación del módulo de modelos mixtos debería

incluirse Especie_Bolsa como factor de clasificación y T1 y T2 como covariables.

Luego en la solapa de los efectos fijos del modelo debería verse como se muestra en la

Figura 92.


0 10 20 30 40 50 60 70 80 90Tiempo

-4.0

-3.5

-3.0

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

LnPe

soSe

co



128

Figura 91: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de la materia seca residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes

ordenadas y pendientes. Archivo Descomposición.IDB2.

Figura 92: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la

especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.


129

Figura 93: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Los residuos del modelo ajustado según Figura 92, muestran dos problemas:

heteroscedasticidad (que depende del tiempo y los tratamientos) y falta de ajuste, ya que

para algunos tratamientos y tiempos, los residuos de Pearson aparecen por encima o por

debajo de la línea del cero (Figura 94).

En este punto optaremos por modelar primeramente, el problema de heteroscedasticidad

utilizando varianzas diferentes para cada combinación Especie-Bolsa. Para ello, en la

ventana de especificación del modelo dejaremos la parte fija tal cual se indicó en la

Figura 92, pero en la solapa Heteroscedasticidad indicaremos que la varianza debe ser

estimada de manera diferente para la combinación de tiempo y tratamiento según se

muestra en la Figura 95. Los residuos estudentizados vs. tiempo para este modelo se

presentan en la (Figura 96). Aún cuando se pudo subsanar, en gran medida, el problema

de la heteroscedasticidad, persisten problemas de falta de ajuste que se visualizan en

conjuntos de residuos de un único tratamiento en un tiempo dado que quedan ya sean

todos positivos o negativos.


0 10 20 30 40 50 60 70 80 90Tiempo

-4.00

-3.50

-3.00

-2.50

-2.00

-1.50

-1.00

-0.50

0.00

0.50

1.00

1.50

LnPe

soSe

co



130

Figura 94: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en

función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Figura 95: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material

vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.


0 23 45 68 90Tiempo

-7.00

-6.00

-5.00

-4.00

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

4.00

Res

iduo

s Ln

Peso

Seco

(Pea

rson

)



131

Una forma de resolver esta falta de ajuste, es agregar efectos aleatorios sobre el nivel

medio para las combinaciones de tiempo y tratamientos. Si en la solapa Efectos

aleatorios agregamos Tiempo_Especie_Bolsa y dejamos tildado el casillero

correspondiente a la Constante estamos indicando que se trata de un corrimiento

aleatorio respecto al valor esperado para cada tratamiento y tiempo bajo el modelo de

regresión utilizado (Figura 97). Finalmente, el gráfico de residuos estudentizados de

este modelo muestra una imagen donde no hay evidencia de falta de ajuste o presencia

de heteroscedasticidad (Figura 98).

Figura 96: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente

en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.


0 23 45 68 90Tiempo

-2.50

-1.25

0.00

1.25

2.50

Res

iduo

s Ln

Peso

Seco

(Pea

rson

)



132

Figura 97: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en

función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.

Figura 98: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para cada combinación de tiempo y tratamiento, para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos

dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.


0 10 20 30 40 50 60 70 80 90Tiempo

-2.50

-1.25

0.00

1.25

2.50

Res

iduo

s Ln

Peso

Seco

(Pea

rson

)



133

Finalmente, como el propósito de este ensayo fue calcular las tasas de descomposición y

lo que hemos ajustado es un modelo lineal para el logaritmo del peso de materia seca

remanente, podemos estimar la tasa de descomposición como la derivada de

-exp(modelo ajustado). Utilizaremos la interfase con R para obtener estas derivadas.

Apretando la tecla F9 se invoca la ventana del intérprete de R (Figura 99). A la derecha

de la ventana aparecerán una lista de los objetos R que se hayan creado durante la sesión

de trabajo. En esta lista debe aparecer el modelo ajustado utilizando el modulo de

modelos mixtos, el nombre de estos objetos es “modelo”+ número correlativo_nombre

de la variable dependiente_método de estimación. En nuestro ejemplo debería aparecer

modelo#_LnPesoSeco_REML (en la posición # debe haber un número que depende del

número de veces que se ajusto un modelo para la misma variable dependiente). En el

ejemplo figura el modelo modeloOO1_LnPesoSeco_REML.

Figura 99: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la salida de la ejecución de un script o de la visualización de un objeto, Objetos: la

lista de los objetos residente en la memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que envía R a la consola.

Para calcular las tasas de descomposición tenemos que comprender qué es lo que hemos

ajustado con el modelo lineal estimado. La parte fija de modelo propuesto fue:


134

Especie_Bolsa T1 T2 Especie_Bolsa*T1

Especie_Bolsa*T2

Este modelo es equivalente a:

Especie_Bolsa-1 Especie_Bolsa*T1

Especie_Bolsa*T2

La ventaja de esta forma resumida de especificarlo es que los coeficientes de la parte

fija aparecen directamente como en la equación (10).

Este modelo especifica una regresión polinómica de segundo grado en el tiempo

(centrado alrededor de 30 días) para cada una de las combinaciones de Especie y

tramado de Bolsa. Así, lo que estimamos es una función de la forma:

( ) ( )20 1 2ln 30 30i i iPesoSeco T Tβ β β= + − + − (10)

Donde el índice i indica el tratamiento (en este caso i identifica a las cuatro

combinaciones de Especie y tramado de Bolsa). Es decir que vamos a tener una

ecuación como (10) específica para cada condición. Los coeficientes estimados de la

parte fija pueden obtenerse durante la estimación del modelo tildando, en la solapa

Efectos fijos, la opción Mostrar coeficientes de la parte fija.

Como vamos a utilizar R para calcular las derivadas de (10), revisaremos estos

coeficientes desde R. Si en la ventana Script escribimos:

Modelo004_LnPesoSeco_REML$coefficients$fixed

y apretamos al final de la línea Shift Enter aparecerá en el output la siguiente salida:

Especies_BolsaFicus_Fino Especies_BolsaFicus_Grueso -0.7738921650 -1.3680878569 Especies_BolsaGuadua_Fino Especies_BolsaGuadua_Grueso 0.8162357629 0.7630705376 Especies_BolsaFicus_Fino:T1 Especies_BolsaFicus_Grueso:T1


135

-0.0326126598 -0.0508364778 Especies_BolsaGuadua_Fino:T1 Especies_BolsaGuadua_Grueso:T1 -0.0086055613 -0.0192635993 Especies_BolsaFicus_Fino:T2 Especies_BolsaFicus_Grueso:T2 0.0002938702 0.0004422140 Especies_BolsaGuadua_Fino:T2 Especies_BolsaGuadua_Grueso:T2 0.0000571603 -0.0002451274

Los primeros 4 coeficientes (leyendo de izquierda a derecha), corresponden a las

ordenadas al origen ( )0iβ de: Ficus_Fino, Ficus_Grueso, Guadua_Fino y

Guadua_Grueso.

Los segundos 4 coeficientes (-0.0326126598,…,,-0.0192635993) son los coeficientes

( )1iβ del término lineal de (10) y los últimos 4 (0.0002938702,…, -0.0002451274) son

los coeficientes ( )2iβ del término cuadrático en (10). Por ejemplo, el peso seco

remanente para la Especie Ficus con Bolsa de tramado Fino la ecuación será:

2ln 0.7738921651 0.0326126598 ( 30) 0.0002938702( 30)PesoSeco T T= − − − + −

Como la función (10) representa el peso seco remanente, el peso descompuesto debería

calcularse como:

( ) ( )( )20 1 2exp 30 30i i iPesoSecoConsumido PesoInicial T Tβ β β= − + − + − (11)

En tanto la tasa de descomposición, sería la derivada de esta función, es decir:

( ) ( )( ) ( )( )20 1 2 1 2exp 30 30 2 30i i i i iTasaDescomp T T Tβ β β β β= − + − + − + − (12)

El siguiente script genera una tabla cuya primera columna es el tiempo y las restantes

las tasas de descomposición para cada uno de los tratamientos. Tener en cuenta que se

debe especificar el modelo que mejor ajustó (en nuestro caso modelo004):

a=modelo004_LnPesoSeco_REML$coefficients$fixed T=seq(0,90,1) dFF = -exp(a[1]+(T-30)*a[5]+(T-30)*(T-30)*a[9]) *(a[5]+2*(a[9] *(T-30))) dFG = -exp(a[2]+(T-30)*a[6]+(T-30)*(T-30)*a[10])*(a[6]+2*(a[10]*(T-30))) dGF = -exp(a[3]+(T-30)*a[7]+(T-30)*(T-30)*a[11])*(a[7]+2*(a[11]*(T-30))) dGG = -exp(a[4]+(T-30)*a[8]+(T-30)*(T-30)*a[12])*(a[8]+2*(a[12]*(T-30)))

Tasas=as.data.frame=cbind(T,dFF,dFG,dGF,dGG)


136

En la lista de objetos aparecerán los objetos a, T, dFF, dFG, dGF, dGG y Tasas.

Haciendo clic sobre Tasas, con el botón derecho del ratón aparecerá un menú de

acciones entre las que se encuentra Convertir matriz, data frame o vector a tabla

InfoStat. Seleccionando esta opción obtendremos una nueva tabla InfoStat como la que

se muestra a la derecha de este párrafo.

Utilizando el submenú Diagrama de dispersión en el menú Gráficos podemos obtener

una representación de las tasas de descomposición. Para ello se asignaron las variables

dFF, dFG, dGF y dGG al Eje Y y la variable T al Eje X, en la ventana de diálogo

emergente del submenú Diagrama de dispersión (Figura 100).


137

Figura 100: Curvas de tasas de descomposición según especie y tramado de la bolsa de almacenamiento.

Ficus Fino Ficus Grueso Guadua Fino Guadua Grueso

0 10 20 30 40 50 60 70 80 90Tiempo

0.000.010.020.030.040.050.060.070.080.090.100.110.120.130.140.15

Tasa

de

desc

ompo

sici

ón

Ficus Fino Ficus Grueso Guadua Fino Guadua Grueso


138

Uso de modelos mixtos para el control de la variabilidad espacial en ensayos agrícolas

Correlación espacial

La estratificación o bloqueo de parcelas es una técnica usada para controlar los efectos

de variación entre las unidades experimentales. Los bloques son grupos de unidades

experimentales formados de manera tal que las parcelas dentro de los bloques sean lo

más homogéneas posible. Los diseños con estratificación de parcelas tales como el

diseño en bloques completos aleatorizados (DBCA), los diseños en bloques incompletos

y los látices son más eficientes que el diseño completamente aleatorizado cuando las

diferencias entre unidades experimentales que conforman un mismo estrato (bloque) son

mínimas y las diferencias entre los estratos son máximas. Cuando esta condición no se

cumple puede ocurrir una sobrestimación de la varianza del error y, si los datos son

desbalanceados, también puede presentarse un sesgo en las estimaciones de los efectos

de tratamientos. Cuando se evalúan muchos tratamientos en parcelas a campo, el

tamaño de los bloques necesarios para lograr una repetición del ensayo es grande y por

tanto resulta difícil asegurar la homogeneidad de las parcelas que conforman el bloque;

las parcelas más próximas pueden ser más similares que las más distantes, generando

variabilidad espacial (Casanoves et ál. 2005). La variabilidad espacial se refiere a la

variación entre observaciones realizadas sobre parcelas con arreglos espaciales sobre el

terreno. Debido a la existencia de variabilidad espacial dentro de bloques, el análisis de

varianza estándar para los diseños que involucran el bloqueo de unidades

experimentales no siempre elimina los sesgos en las comparaciones de efectos de

tratamientos. La variación de parcela a parcela dentro de un mismo bloque puede

deberse a competencia, heterogeneidad en la fertilidad del suelo, dispersión de insectos,

malezas, enfermedades del cultivo o labores culturales, entre otros. Por este motivo se

han propuesto procedimientos estadísticos que contemplan la variación espacial entre

parcelas y que van desde el ajuste de medias de tratamientos en función de lo observado

en las parcelas vecinas más cercanas (Papadakis 1937), hasta el uso de modelos que

contemplan las correlaciones espaciales en términos del error y que también producen

ajustes de medias de tratamientos (Mead 1971, Besag 1974, 1977, Ripley 1981).

Gilmour et ál. (1997) particionan la variabilidad espacial entre parcelas de un ensayo en

variabilidad espacial local y global. La variabilidad espacial local hace referencia a las


139

diferencias entre parcelas a pequeña escala, donde se contemplan las variaciones intra-

bloque. La tendencia espacial local y la heterogeneidad residual se modelan mediante la

matriz de varianza y covarianza residual. A través de un sistema de coordenadas

bidimensionales es posible definir la ubicación de las parcelas en el campo.

La modelación de la estructura espacial de parcelas a partir de funciones de distancia

puede realizarse en el contexto de los modelos lineales mixtos (Zimmerman y Harville

1991, Gilmour et ál. 1997, Cullis et ál. 1998), donde además de contemplar la estructura

de correlación entre observaciones provenientes de distintas parcelas es posible modelar

heterogeneidad de varianza residual. Esto es muy útil en los ensayos comparativos de

rendimiento ya que estos se llevan a cabo en distintos ambientes. Si la correlación solo

depende de la distancia (magnitud y/o dirección de las distancias), los modelos que

estiman las covarianzas entre observaciones se denominan estacionarios. Las funciones

de correlación para modelos estacionarios pueden ser isotrópicas o anisotrópicas. Las

primeras son idénticas en cualquier dirección (sólo dependen de la magnitud de las

distancias) mientras que las segundas permiten diferentes valores de sus parámetros en

diferentes direcciones (i.e. dependen también de la dirección sobre la cual se calculan

las distancias).

Análisis de un ensayo comparativo de rendimientos en maní

Para ejemplificar las alternativas de análisis usaremos los datos que se encuentran en el

archivo ECRmaní.IDB2 y provienen de un año agrícola de un ensayo comparativo de

rendimientos (ECR) de líneas experimentales (genotipos) de maní (Arachis hypogaea

L.) del Programa de Mejoramiento de Maní de la EEA-Manfredi, INTA, Argentina. En

cada campaña los ECR se realizaron en tres localidades del área de cultivo en la

provincia de Córdoba: Manfredi, General Cabrera y Río Tercero. El conjunto de líneas

evaluadas fue el mismo para cada localidad. En cada una de las tres localidades los

ensayos fueron conducidos según un DBCA con cuatro repeticiones, registrándose los

valores de rendimiento en grano (kg/parcela).

Los datos de rendimiento fueron analizados usando distintas modificaciones del

siguiente modelo:

; 1,..,16; 1,..., 4; 1,...,3ijk i j k jk ik ijky i j kµ τ γ η δ ϕ ε= + + + + + + = = = (13)

http://dl.dropbox.com/u/65302225/Datos/ECRmani.IDB2�


140

donde ijky representa la respuesta observada en i-ésimo nivel del factor genotipo,

j-ésimo nivel de factor bloque, y k-ésimo nivel del factor localidad, µ representa la

media general de la respuesta, iτ representa el efecto del i-ésimo nivel del factor

genotipo, jγ representa el efecto del j-ésimo nivel del factor bloque, kη el k-ésimo nivel

del factor localidad y ikϕ la interacción entre los factores genotipo y localidad, ikδ el

efecto de bloque dentro de localidad, y ijklε representa el error experimental. La

suposición usual es que ( )2~ 0,ijkl N εε σ .

Excepto por εijk y los efectos de bloque (cuando son considerados aleatorios) en la

mayoría de los casos, todos los factores del modelo serán considerados como de efectos

fijos. Esto tiene la finalidad de restringir la comparación de los modelos a su estructura

de parcelas. Las distintas estructuras de parcela inducen una estructura de correlación

entre las observaciones que puede ser contemplada en el marco de los modelos mixtos,

incluyendo técnicas de análisis para el control de la variabilidad espacial.

Se usarán las siguientes estructuras de covarianza para los datos (covarianza marginal):

1. Modelo BF: Efecto de Bloques fijos, errores independientes y varianza entre localidades constante.

2. Modelo BA: Efecto de Bloques aleatorios, errores independientes y varianza entre localidades constante.

3. Modelo BFH: Efecto de Bloques fijos, errores independientes y varianzas diferentes entre localidades.

4. Modelo BAH: Efecto de Bloques aleatorios, errores independientes y varianzas diferentes entre localidades.

5. Modelo Exp: Correlación espacial exponencial sin efecto de bloques y varianza entre localidades constante.

6. Modelo BFExp: Correlación espacial exponencial, efecto de bloques fijos, y varianza entre localidades constante.

7. Modelo ExpH: Correlación espacial exponencial sin efecto de bloques y varianzas diferentes entre localidades.

8. Modelo Gau: Correlación espacial Gaussiana sin efecto de bloques y varianza entre localidades constante.

9. Modelo Esf: Correlación espacial esférico sin efecto de bloques y varianza entre localidades constante.

En los dos primeros modelos los εijk se asumirán como independientes con varianza

constante σ2, i.e. se supone que no existe variación espacial local (intrabloque) y

además existe homogeneidad de varianzas residuales entre localidades. Los efectos de


141

bloque serán considerados fijos y aleatorios, denotando los procedimientos como

Modelo BF y Modelo BA respectivamente.

Los procedimientos denotados como Modelo BFH y Modelo BAH se basarán también

en un modelo para un DBCA pero contemplando la posibilidad de varianzas residuales

heterogéneas según los distintos niveles del factor localidad.

El quinto procedimiento consistirá en ajustar para cada localidad un modelo de

correlación espacial isotrópico con función de correlación potencia (Modelo Exp) sin

declarar el efecto de bloques. Este modelo supone que la función exponencial no solo

contemplará la variación intrabloque sino también la variación entre bloques.

El sexto procedimiento fue igual al anterior pero agregando un efecto fijo de bloque

(Modelo BFExp).

El séptimo modelo consistió en un modelo como el Exp pero permitiendo la posibilidad

de varianzas (y correlaciones) diferentes para cada localidad.

Los dos últimos procedimiento consistirán en ajustar para cada localidad un modelo de

correlación espacial isotrópico con función de correlación Gaussiana (Modelo Gau) y

con función de correlación Esférica, sin declarar el efecto de bloques.

En todos los casos se utilizó estimación REML. En el selector de variables se indica al

rendimiento (Rendim) como dependiente y bloque, local y geno como clasificatorias.

Para ajustar el Modelo BF, en la solapa de efectos fijos se deben declarar los efectos

como se muestra en la Figura 101. No se declara nada en el resto de las solapas.

Para ajustar el Modelo BA, en la solapa efectos fijos y efectos aleatorios debe declararse

los factores como se presenta en la Figura 102 y Figura 103 respectivamente. No se

declara nada en el resto de las solapas.


142

Figura 101: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BF.

Figura 102: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BA.


143

Figura 103: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo BA.

Los modelos BFH y BAH contemplan errores independientes y varianzas entre

localidades diferentes. Para especificar estos modelos, se procede igual que en los dos

casos anteriores (i.e. BF y BA) pero agregando una función varIdent en la solapa

Heteroscedasticidad, indicando como criterio de agrupamiento a la localidad (local).

Una vez declarada la función y el criterio de agrupamiento hacer clic en Agregar

(Figura 104).


144

Figura 104: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y los Modelos BFH y BAH.

El quinto modelo no incluye el efecto de bloque y modela la variabilidad entre bloques

e intra-bloque por medio de una función exponencial isotrópica (modelo Exp) con

varianzas constantes entre localidades. Par usar la función exponencial deberemos

agregar al modelo las variables que denotan las coordenadas espaciales. Para esto en el

selector de variables debemos colocar las variables la y lon en Covariables. En la solapa

Efectos fijos dejamos geno, local y geno*local y en la solapa Efectos aleatorios no se

declara ningún factor. En la solapa Heteroscedasticidad no debe quedar ninguna

función declarada. Para declarar la correlación espacial tipo exponencial, en la solapa

Correlación se debe seleccionar la función correspondiente y declarar las coordenadas

en X y en Y, y el criterio de agrupamiento, en este caso local, ya que hay un sistema de

coordenadas dentro de cada localidad (Figura 105).


145

Figura 105: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e Y respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y

los Modelos Exp y BFExp.

El sexto modelo, Modelo BFExp, es igual que el anterior pero declarando los efectos de

bloque dentro de localidad como fijos (como en la Figura 101). La inclusión de los

bloques fijos restringe la modelación de la variación espacial únicamente a la variación

dentro de bloque. La variación entre bloques está siendo contemplada, en un sentido

clásico, por la inclusión de los bloques en la parte fija. Así, declarar como coordenadas

del modelo de correlación espacial a la y lon, parece redundante ya que bastaría con

declarar sólo lon (coordenada que varia dentro de bloque). Sin embargo para omitir la

coordenada la sería necesario declara un nuevo criterio de estratificación consistente en

la combinación de los niveles de local y bloque. Esta forma alternativa produce

idénticos resultados a los mostrados en el modelo BFExp.

El séptimo modelo, modelo ExpH, es como el modelo Exp pero permitiendo varianzas

heterogéneas entre las localidades (como en la Figura 104). Los modelos Gau y Esf se

ajustan al igual que el Exp sin el efecto de bloque, y como se muestra en la Figura 105,


146

pero eligiendo la función de correlación espacial Gaussiana y esférica respectivamente.

En la solapa Heteroscedasticidad no debe quedar nada declarado.

A continuación se presentan las salidas con las medidas de ajuste de los diferentes

modelos.

Modelo BF Modelos lineales generales y mixtos Especificación del modelo en R modelo000_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo000_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 299.71 468.22 -91.86 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 8372.75 <0.0001 local 2 280.56 <0.0001 geno 15 6.02 <0.0001 local:geno 30 4.32 <0.0001 local:bloque 9 4.77 <0.0001

Modelo BA Modelos lineales generales y mixtos Especificación del modelo en R modelo001_rendim_REML<-lme(rendim~1+local+geno+local:geno ,random=list(bloque_local=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo001_rendim_REML Variable dependiente:rendim


147

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 192 283.41 431.90 -91.71 0.35 0.81 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 135 1754.21 <0.0001 local 2 9 58.78 <0.0001 geno 15 135 6.02 <0.0001 local:geno 30 135 4.32 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|bloque_local Desvíos estándares relativos al residual y correlaciones (const) (const) 0.49

Modelo BFH Modelos lineales generales y mixtos Especificación del modelo en R modelo002_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,weight=varComb(varIdent(form=~1|local)) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo002_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 303.44 477.75 -91.72 0.36 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 8547.37 <0.0001 local 2 292.67 <0.0001 geno 15 6.02 <0.0001 local:geno 30 4.36 <0.0001 local:bloque 9 4.76 <0.0001 Estructura de varianzas


148

Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.92 rio3 0.96

Modelo BAH Modelos lineales generales y mixtos Especificación del modelo en R modelo003_rendim_REML<-lme(rendim~1+local+geno+local:geno ,random=list(bloque_local=pdIdent(~1)) ,weight=varComb(varIdent(form=~1|local)) ,method="REML" ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo003_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 192 287.12 441.55 -91.56 0.36 0.81 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 135 1765.74 <0.0001 local 2 9 59.53 <0.0001 geno 15 135 6.01 <0.0001 local:geno 30 135 4.36 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|bloque_local Desvíos estándares relativos al residual y correlaciones (const) (const) 0.46 Estructura de varianzas


149

Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.92 rio3 0.95 Modelo Exp Modelos lineales generales y mixtos Especificación del modelo en R modelo004_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo004_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 273.43 421.92 -86.72 0.39 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1687.54 <0.0001 geno 15 7.27 <0.0001 local 2 56.18 <0.0001 geno:local 30 5.33 <0.0001 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.96


150

Modelo BFExp Modelos lineales generales y mixtos Especificación del modelo en R modelo005_rendim_REML<-gls(rendim~1+geno+local+local:geno+local/bloque ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo005_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 284.85 456.26 -83.42 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 2785.57 <0.0001 geno 15 7.86 <0.0001 local 2 92.79 <0.0001 geno:local 30 5.74 <0.0001 local:bloque 9 3.46 0.0007 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.78


151

Modelo ExpH Modelos lineales generales y mixtos Especificación del modelo en R modelo006_rendim_REML<-gls(rendim~1+geno+local+local:geno ,weight=varComb(varIdent(form=~1|local)) ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo006_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 275.01 429.44 -85.50 0.43 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 1633.46 <0.0001 geno 15 7.15 <0.0001 local 2 61.51 <0.0001 geno:local 30 5.53 <0.0001 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.99 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | local Parámetros de la función de varianza Parámetro Estim gralcabr 1.00 manf 0.85 rio3 0.81


152

Modelo Gau

Modelos lineales generales y mixtos Especificación del modelo en R modelo007_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corGaus(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo007_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 277.81 426.30 -88.90 0.37 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3399.06 <0.0001 geno 15 7.36 <0.0001 local 2 113.57 <0.0001 geno:local 30 4.97 <0.0001 Estructura de correlación Modelo de correlación: Gaussian spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.87


153

Modelo Esf Modelos lineales generales y mixtos Especificación del modelo en R modelo008_rendim_REML<-gls(rendim~1+geno+local+local:geno ,correlation=corSpher(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data05) Resultados para el modelo: modelo008_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 277.72 426.21 -88.86 0.38 0.81 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3170.04 <0.0001 geno 15 7.61 <0.0001 local 2 105.96 <0.0001 geno:local 30 5.15 <0.0001 Estructura de correlación Modelo de correlación: Spherical spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 1.91

Comparación de los modelos ajustados

Debido a que los modelos ajustados tienen distintas componentes en su parte fija, se

compararán por medio de los criterios AIC y BIC aquellos que comparten los mismos

efectos fijos. En primer lugar se comparan entonces el BF, BFH y BFExp (Cuadro 3).


154

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo ECRmani.IDB2

Modelo AIC BIC

BF 299.72 468.22

BFH 303.44 477.75

BFExp 284.85 456.26

Para este grupo de modelos que contemplan efecto de bloques fijos se puede ver que el

modelo con bloques fijos más una función de correlación exponencial provee el mejor

ajuste. Esto implica la existencia de una correlación intra-bloque que es removida por la

función de correlación exponencial. También se puede observar que no hay una mejora

en estos modelos al permitir varianzas heterogéneas entre localidades (BF respecto a

BFH). Si se calculan las varianzas a partir de los coeficientes para las distintas

localidades se puede ver que estas son realmente similares:

Varianza de gralcabr = (1*0.36)2 = 0.129

Varianza de manf = (0.92*0.36)2 = 0.109

Varianza de rio3 = (0.96*0.36)2 = 0.119

Los restantes 6 modelos se pueden comparar entre sí ya que todos comparten los

mismos efectos fijos, i.e. geno, local y geno*local (Cuadro 4).

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo ECRmani.IDB2

Modelo AIC BIC

BA 283.41 431.90

BAH 287.12 441.55

Exp 273.43 421.92

ExpH 275.01 429.44

Gau 277.81 426.30

Esf 277.72 426.21


155

Dentro de los modelos que contemplan efectos de bloque aleatorio se puede ver

nuevamente que al permitir varianzas heterogéneas entre localidades el modelo no

mejora, ya que AIC y BIC son más pequeños en BA comparados con BAH. Lo mismo

ocurre cuando sólo se modela la variabilidad espacial por medio de una función de

correlación exponencial, ya que al permitir varianzas heterogéneas (ExpH) no se logra

una mejoría respecto a Exp.

Comparando distintos modelos de correlación espacial, no se encontraron diferencias

importantes para AIC y BIC entre los modelos Gau y Esf, pero estos criterios tuvieron

valores inferiores para la función de correlación espacial exponencial. Este último

modelo fue el de mejor ajuste dentro de los modelos sin efecto de bloque fijo.

Si bien el primer grupo de modelos (BF, BFH y BFExp) no son comparables por medio

de AIC y BIC con este último grupo, el investigador deberá poder discernir si sus

bloques deben ser considerados fijos o aleatorios. La elección de uno u otro grupo de

modelos tendrá efecto sobre las inferencias que se realicen. Esto se visualiza fácilmente

al ver que los errores estándar usados para las comparaciones de medias cambian entre

los modelos. Una discusión más detallada sobre la elección de bloques fijos o aleatorios

puede encontrarse en Casanoves et ál. (2007).

En este ejemplo los mejores modelos dentro de cada grupo (i.e. BFExp y Exp para el

primero y segundo grupo de modelos respectivamente) tienen la misma estructura de

covarianza pero difieren en su parte fija: unos contienen el efecto de bloque y otros no.

Para decidir cuál de los dos modelos es el que conviene, podemos realizar una prueba de

cociente de verosimilitudes, usando las estimaciones por ML para los modelos con y sin

efectos de bloque (recordemos que para comparar modelos con distintos efectos fijos se

debe usar ML):

Modelo con bloque (completo BFExp):

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 163.82 356.01 -22.91 0.29 0.86 AIC y BIC menores implica mejor

Modelo sin bloque (reducido Exp):



156

Así, el estadístico 2log lik 2log lik 2( 22.91 41.43) 37.04completo reducidoG = − = − + = con 9

grados de libertad, y un valor p<0.0001, por lo que podemos decir, con una

significancia del 5%, que conviene dejar el efecto de bloques fijos y la función de

correlación exponencial. La comparación se puede hacer manualmente, o utilizando el

módulo Análisis exploratorio de un modelo estimado. Seleccionando la solapa, Modelos

y tildando los modelos estimados correspondientes a BFExp y ExP, se obtienen la salida

mostrada a continuación.

Comparación de modelos Model df logLik Test L.Ratio p-value modelo009_rendim_ML 1 59 -22.91 modelo010_rendim_ML 2 50 -41.43 1 vs 2 37.04 <0.0001

A continuación se presenta la salida completa correspondiente al modelo BFExp. Las

pruebas de hipótesis para la interacción entre genotipo y localidad son significativas

(p<0.0001) por lo que la recomendación de un genotipo puede cambiar dependiendo de

la localidad. Puede observarse que debido al ajuste de la función de correlación espacial

los EE de los genotipos no son únicos. Las comparaciones múltiples presentadas se

realizaron mediante la aplicación del procedimiento DGC (Di Rienzo et ál. 2002). Esta

procedimiento fue adaptado para contemplar las particularidades de la estructura de

correlación entre estimaciones emergente de los modelos mixtos. La aplicación de este

procedimiento es recomendada por el gran número de medias a comparar, ya que

asegura una interpretación más sencilla que la que puede obtenerse de la aplicación de

un test tipo LSD de Fisher. Para hacer recomendaciones se pueden usar las

comparaciones de medias de las combinaciones de localidades y genotipos como así

también el grafico de interacción (Figura 106).

Modelos lineales generales y mixtos Especificación del modelo en R modelo010_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque ,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.character(lon))|local ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data03)


157

Resultados para el modelo: modelo010_rendim_REML Variable dependiente:rendim Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 192 284.85 456.26 -83.42 0.35 0.86 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 2785.57 <0.0001 local 2 92.79 <0.0001 geno 15 7.86 <0.0001 local:geno 30 5.74 <0.0001 local:bloque 9 3.46 0.0007 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(la)) + as.numeric(as.character(lon)) | local Metrica: euclidean Parámetros del modelo Parámetro Estim range 0.78 Medias ajustadas y errores estándares para local DGC (alfa=0.05) local Medias E.E. manf 3.00 0.08 A gralcabr 2.27 0.08 B rio3 1.56 0.08 C Medias con una letra común no son significativamente diferentes (p<= 0.05) Medias ajustadas y errores estándares para geno DGC (alfa=0.05) geno Medias E.E. mf435 2.73 0.10 A mf407 2.59 0.10 A mf429 2.51 0.10 A mf415 2.49 0.10 A mf420 2.38 0.10 B mf421 2.36 0.10 B mf431 2.34 0.10 B mf405 2.31 0.10 B manf68 2.24 0.10 B mf408 2.22 0.10 B manf393 2.22 0.10 B colirrad 2.21 0.10 B mf404 2.14 0.10 B mf433 1.96 0.10 C mf432 1.96 0.10 C mf410 1.78 0.10 C Medias con una letra común no son significativamente diferentes (p<= 0.05)


158

Medias ajustadas y errores estándares para local*geno DGC (alfa=0.05) local geno Medias E.E. manf mf407 3.67 0.17 A manf mf421 3.54 0.17 A manf mf405 3.38 0.17 B manf mf431 3.28 0.17 B manf mf435 3.24 0.17 B manf manf68 3.23 0.17 B manf mf420 3.17 0.17 B manf mf429 3.08 0.17 B manf colirrad 3.05 0.17 B manf manf393 3.02 0.17 B gralcabr mf435 2.96 0.17 B manf mf408 2.90 0.17 B manf mf415 2.90 0.17 B gralcabr mf420 2.82 0.17 B gralcabr mf404 2.71 0.17 C manf mf433 2.64 0.17 C gralcabr mf415 2.61 0.17 C manf mf410 2.53 0.17 C gralcabr mf429 2.52 0.17 C manf mf432 2.48 0.17 C gralcabr mf421 2.42 0.17 C gralcabr mf408 2.32 0.17 C gralcabr manf393 2.30 0.17 C gralcabr mf407 2.30 0.17 C gralcabr mf405 2.25 0.17 C gralcabr mf431 2.05 0.17 D gralcabr manf68 2.04 0.17 D rio3 mf435 1.99 0.17 D rio3 mf415 1.98 0.17 D manf mf404 1.97 0.17 D rio3 mf429 1.93 0.17 D gralcabr colirrad 1.92 0.17 D rio3 mf432 1.89 0.17 D rio3 mf407 1.81 0.17 D gralcabr mf410 1.79 0.17 D gralcabr mf433 1.77 0.17 D rio3 mf404 1.74 0.17 D rio3 mf431 1.70 0.17 D rio3 colirrad 1.64 0.17 D gralcabr mf432 1.50 0.17 E rio3 mf433 1.47 0.17 E rio3 manf68 1.45 0.17 E rio3 mf408 1.44 0.17 E rio3 manf393 1.33 0.17 E rio3 mf405 1.32 0.17 E rio3 mf420 1.16 0.17 E rio3 mf421 1.14 0.17 E rio3 mf410 1.02 0.17 E Medias con una letra común no son significativamente diferentes (p<= 0.05)


159

Figura 106: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la variable Rendimiento.

Manfredi General Cabrera Río Tercero

mf4

04

mf4

32

mf4

10

mf4

33

mf4

15

man

f393

mf4

08

mf4

29

colir

rad

mf4

20

mf4

31

man

f68

mf4

35

mf4

05

mf4

21

mf4

07

Genotipo

0

1

2

3

4

Ren

dim

ient

o (k

g/pa

rcel

a)

Manfredi General Cabrera Río Tercero


Aplicaciones de modelos mixtos en otros diseños experimentales

Diseño en franjas (strip-plot)

El diseño strip-plot es un resultado de las restricciones a la aleatorización. Al igual que

en el diseño en parcelas divididas, el strip-plot es un resultado de cómo fue llevado a

cabo un experimento que involucra dos o más factores. Estos factores (o sus

combinaciones) se aplican en diferentes etapas, generalmente 2, y las restricciones a la

aleatorización producen las unidades experimentales de diferentes tamaños y por ende

diferentes términos de error para cada una de los factores o sus combinaciones (Milliken

y Johnson 1992).

Consideremos un ejemplo donde se desean evaluar tres niveles de fertilización con N (0,

50 y 100 kg/ha de N) y dos niveles de riego (bajo y alto) sobre los rendimientos de

maíz. El ensayo se condujo bajo un diseño en bloques completos al azar con cuatro

bloques (datos: StripPlot.IDB2).

Debido a restricciones de la aplicación de los tratamientos, en una primera etapa, en

cada uno de los bloques, se aleatorizan los tres niveles de nitrógeno y en la segunda

etapa, en cada bloque y en sentido trasversal al sentido de aplicación de los niveles de

nitrógeno, se aleatorizan los niveles del factor riego.

Si bien en el siguiente esquema (Figura 107) se presenta la aleatorización dentro de un

bloque en particular, el experimento ha sido repetido en bloques, esquema necesario

para poder obtener los distintos términos de error y que el modelo resultante tenga

sentido. Si en alguna etapa del diseño hubiera más de un factor, por ejemplo en las filas

se combianan dos fertilizantes con sus niveles y estos no interactuaran entre sí, se

podrían usar las interacciones de más alto orden como términos de error y así poder

obtener las pruebas F sin necesidad de repeticiones.

http://dl.dropbox.com/u/65302225/Datos/StripPlot.IDB2�


162

Etapa 1

100 kg N/ha

0 kg N/ha

50 kg N/ha

Etapa 2

Riego alto Riego bajo

Figura 107: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques completos al azar, con la aleatorización para un bloque particular de los factores cantidad de

nitrógeno y cantidad de riego. Datos del archivo StripPlot.IDB2.

Los datos de rendimiento se analizaron usando el siguiente modelo:

; 1,..,3; 1, 2; 1,..., 4ijk i j ij k ki kj kijy b f c e i j kµ τ γ λ= + + + + + + + = = = (14)

donde ijky representa la respuesta observada en el i-ésimo nivel del factor nitrógeno,

j-ésimo nivel de factor riego y k-ésimo nivel del factor bloque (efecto aleatorio) µ

representa la media general de la respuesta, iτ representa el efecto del i-ésimo nivel del

factor nitrógeno, jγ representa el efecto del j-ésimo nivel del factor riego, ijλ la

interacción entre los factores nitrógeno y riego, kb el k-ésimo nivel del factor bloque,


163

kif el efecto del bloque k en el nivel i de nitrógeno (efecto aleatorio), kjc el efecto del

bloque k en el nivel j de riego (efecto aleatorio), y kije representa el error residual. La

suposición usual es que ( ) ( ) ( ) ( )2 2 2 2~ 0, , ~ 0, , ~ 0, y ~ 0,k b ki f kj c kij eb N f N c N e Nσ σ σ σ ,

siendo todos mutuamente independientes.

Para explorar las medias observadas en cada combinación de nitrógeno y riego se

construyó un gráfico de puntos (Figura 108).

Figura 108: Diagramas de puntos de las medias de rendimiento para cada combinación de Riego y Nitrógeno. Datos archivo StripPlot.IDB2.

Este modelo puede ajustarse en InfoStat en el menú Modelos lineales generales y

mixtos, declarando a Rendimiento como variable dependiente y a Riego, Nitrógeno y

Bloque como variables clasificatorias. Luego, en la solapa Efectos fijos se declaran los

siguientes términos (Figura 109).

Riego AltoRiego Bajo

0 50 100Nitrogeno

55

60

65

70

75

80

Ren

dim

ient

o

Riego AltoRiego Bajo


164

Figura 109: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo StripPlot.IDB2.

En la solapa Efectos aleatorios se debe declarar el efecto de Bloque tanto en la

constante ( )kb como en los factores fijos Nitrógeno y Riego ( kif y kjc respectivamente)

(Figura 110).


165

Figura 110: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del archivo StripPlot.IDB2.

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 24 106.09 115.00 -43.05 1.20 0.85 0.94 0.95 0.99 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 15 3061.88 <0.0001 Nitrogeno 2 15 60.13 <0.0001 Riego 1 15 52.18 <0.0001 Nitrogeno:Riego 2 15 33.12 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (const) (const) 1.83


166

Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Nitrogeno - 1|Bloque Desvíos estándares relativos al residual y correlaciones 0 100 50 0 0.70 0.00 0.00 100 0.00 0.70 0.00 50 0.00 0.00 0.70 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Riego - 1|Bloque Desvíos estándares relativos al residual y correlaciones Alto Bajo Alto 1.49 0.00 Bajo 0.00 1.49

Una formulación alternativa de este modelo (con efectos aleatorios cruzados) se puede

obtener si se seleccionan Nitrogeno y Riego, y con el ratón derecho se selecciona

Efectos aleatorios cruzados, según lo indicado en la Figura 111. Las componentes de

varianza aparecen en otro orden, pero son los mismos que bajo la otra formulación.

Figura 111: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los factores Nitrógeno y Riego cruzados para los datos del archivo StripPlot.IDB2.


167

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 24 106.09 115.00 -43.05 1.20 0.85 0.99 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 15 3061.88 <0.0001 Nitrogeno 2 15 60.13 <0.0001 Riego 1 15 52.18 <0.0001 Nitrogeno:Riego 2 15 33.12 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdBlocked Formula: ~Nitrogeno + Riego|Bloque Desvíos estándares relativos al residual y correlaciones (const) 0 100 50 Alto Bajo (const) 1.83 0.00 0.00 0.00 0.00 0.00 0 0.00 0.70 0.00 0.00 0.00 0.00 100 0.00 0.00 0.70 0.00 0.00 0.00 50 0.00 0.00 0.00 0.70 0.00 0.00 Alto 0.00 0.00 0.00 0.00 1.49 0.00 Bajo 0.00 0.00 0.00 0.00 0.00 1.49

Las comparaciones de medias, según los resultados de las pruebas marginales, deben

hacerse a partir de las medias de las combinaciones de niveles de factores que

interactúan significativamente (medias de la interacción).

Medias ajustadas y errores estándares para Nitrogeno LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Nitrogeno Medias E.E. 100 77.38 1.40 A 50 71.75 1.40 B 0 68.25 1.40 C Medias con una letra común no son significativamente diferentes (p<= 0.05) Medias ajustadas y errores estándares para Riego LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Riego Medias E.E. Alto 77.33 1.47 A Bajo 67.58 1.47 B Medias con una letra común no son significativamente diferentes (p<= 0.05)


168

Medias ajustadas y errores estándares para Nitrogeno*Riego LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Nitrogeno Riego Medias E.E. 100 Alto 79.50 1.59 A 50 Alto 77.50 1.59 A B 100 Bajo 75.25 1.59 B C 0 Alto 75.00 1.59 C 50 Bajo 66.00 1.59 D 0 Bajo 61.50 1.59 E Medias con una letra común no son significativamente diferentes (p<= 0.05)

Podemos observar que los mejores rendimientos se obtienen con niveles de riego alto y

nitrógeno 50 o 100, confirmando lo observado en la gráfica de medias (Figura 108).


169

Diseño experimental con dos factores y dependencia espacial

En muchas situaciones se presentan niveles de un factor de interés que, por su

naturaleza, no se pueden asignar en forma aleatoria. Este es el caso de las tomas de

muestras de agua a lo largo de un río, cuando se evalúan efectos a distintas distancias en

un bosque o cuando se toman muestras de suelo a distintas profundidades. El hecho de

que no se puedan aleatorizar los niveles de un factor genera una dependencia espacial

que debe ser contemplada. Aquí presentamos un ejemplo (datos Lombrices.IDB2) en

donde se evalúan cuatro tipo de sombra en cultivos de café: testigo con sol (sol),

leguminosa1 (SombraL1), leguminosa2 (SombraL2) y no leguminosa (SombraNL) en

tres profundidades (1=0-10 cm, 2=10-20 cm y 3=20-30 cm). En cada una de las

unidades experimentales (combinación de tratamientos y repeticiones) se tomaron

muestras de 30×30 cm con 10 cm de profundidad en cada una de las tres profundidades.

En cada muestra se recolectaron las lombrices y se obtuvo su peso vivo (biomasa). Las

unidades experimentales estaban arregladas en un diseño completamente aleatorizado

con tres repeticiones. La variable tratam_rep identifica a las unidades experimentales

sobre las que se miden las distintas profundidades y fue generada desde el menú Datos,

sub menú Cruzar categorias para formar una nueva variable (en la ventana de

selección de variables se declaró a tratam y rep como variables).

Para realizar el análisis de los datos del archivo Lombrices.IDB2, se deben declarar las

variables como se muestra a continuación (Figura 112).

http://dl.dropbox.com/u/65302225/Datos/Lombrices.IDB2�

http://dl.dropbox.com/u/65302225/Datos/Lombrices.IDB2�


170

Figura 112: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo Lombrices.IDB2.

Luego, en la solapa Efectos fijos se deben declarar las variables como se muestra en la

siguiente figura (Figura 113).


171

Figura 113: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo Lombrices.IDB2.

Por último, se declara en la solapa Correlación el modelo de Correlación espacial

exponencial, identificando a profund como coordenada X y a tratam_rep como criterio

de agrupamiento (Figura 114).


172

Figura 114: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación espacial exponencial en los datos del archivo Lombrices.IDB2.

La salida correspondiente se presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,correlation=corExp(form=~as.numeric(as.character(Profund))|Tratam_Rep ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo000_Biomasa_REML Variable dependiente:Biomasa


173

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 161.03 177.52 -66.52 3.46 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3725.04 <0.0001 Tratam 3 66.75 <0.0001 Profund 2 303.14 <0.0001 Tratam:Profund 6 4.86 0.0022 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(Profund)) | Tratam_Rep Metrica: euclidean Parámetros del modelo Parámetro Estim range 2.12

Todos los factores resultaron significativos, presentándose interacción entre

tratamientos y profundidad (p=0.0022). El parámetro range tiene un valor estimado de

2.12. Este parámetro debe interpretarse con cuidado, dependiendo del modelo de

correlación espacial usado. En la bibliografía geoestadística, el range se define, para

procesos espaciales estacionales de segundo orden, como la distancia a partir de la cual

las observaciones pueden considerarse independientes. El parámetro range que se

muestra en la salida está relacionado a esta definición, pero no es la distancia a partir de

la cual no hay más correlación (excepto en los modelos esférico y lineal). En los

modelos de correlación espacial, en los que la covarianza alcanza cero solo

asintóticamente (todos excepto el esférico y el lineal), no existe una distancia a la cual la

correlación espacial se haga 0, por lo que se usa el concepto de practical range

(distancia a partir de la cual la covarianza espacial se reduce al 5%, o equivalentemente,

la distancia a la cual el semivariograma alcanza el 95% de su máximo). Esta distancia

depende del modelo usado: para correlación espacial exponencial es 3 veces el range

estimado, mientras que para correlación espacial Gaussiana es √3 veces el range

estimado (Littel et ál. 2006). Para la correlación racional cuadrática este factor es

aproximadamente 4.36.


174

En este ejemplo se usó un modelo de correlación espacial exponencial. La profundidad

1 era entre 0 y 10 cm, la 2 entre 10 y 20 cm y la 3 entre 20 y 30 cm, es decir, la

diferencia entre la profundidad 1 y 2 de la forma en que fueron declaradas, es de 1, sin

embargo en la escala original esta diferencia es de 10. Por lo tanto, el practical range en

la escala original es de 3×21.2 cm=63.6 cm. Esto implica que, para las profundidades

estudiadas (0 a 30 cm), las observaciones de biomasa de lombrices nunca serán

independientes (para que pudieran considerarse prácticamente independientes las

observaciones deberían estar a más de 63.6 cm, lo que es imposible con estos datos).

El modelo de correlación espacial exponencial isotrópico presentado aquí es equivalente

a un modelo autorregresivo de orden 1 (Casanoves et ál. 2005). Si con este mismo

conjunto de datos usamos ahora un modelo Autorregresivo de orden 1 (Figura 115) se

obtiene la siguiente salida.

Figura 115: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2.


175

Modelos lineales generales y mixtos Especificación del modelo en R modelo001_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo001_Biomasa_REML Variable dependiente:Biomasa Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 161.03 177.52 -66.52 3.46 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3725.05 <0.0001 Tratam 3 66.75 <0.0001 Profund 2 303.14 <0.0001 Tratam:Profund 6 4.86 0.0022 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep Parámetros del modelo Parámetro Estim Phi 0.62

La única diferencia entre esta salida y la anterior es que en ésta se muestra el parámetro

Phi de correlación (0.62) en vez del parámetro range.

A continuación estudiaremos la validez de los supuestos de este modelo. Para esto, en el

submenú Análisis-exploración de los modelos estimados se solicitaron los gráficos de

diagnóstico que se presentan a continuación (Figura 116).


176

Figura 116: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Lombrices.IDB2.

Como se puede observar la variabilidad de los residuos bajo los distintos tratamientos

parece diferente. Para evaluar un modelo heteroscedástico por tratamientos, en la solapa

Heteroscedasticidad se declararon las variables como en la (Figura 117) y se obtuvo la

siguiente salida.


177

Figura 117: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del archivo Lombrices.IDB2.

Modelos lineales generales y mixtos Especificación del modelo en R modelo002_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund ,weight=varComb(varIdent(form=~1|Tratam)) ,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep) ,method="REML" ,na.action=na.omit ,data=R.data00) Resultados para el modelo: modelo002_Biomasa_REML Variable dependiente:Biomasa


178

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 36 164.03 184.06 -65.02 4.20 0.97 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 4300.37 <0.0001 Tratam 3 54.19 <0.0001 Profund 2 511.72 <0.0001 Tratam:Profund 6 6.32 0.0004 Estructura de correlación Modelo de correlación: AR(1) Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep Parámetros del modelo Parámetro Estim Phi 0.73 Estructura de varianzas Modelo de varianzas: varIdent Formula: ~ 1 | Tratam Parámetros de la función de varianza Parámetro Estim sol 1.00 sombraL1 0.65 sombraL2 0.66 sombraNL 1.22

Los criterios AIC y BIC son mayores en el modelo heteroscedástico que en el

homoscedástico, indicando que este último es el mejor. Similar conclusión se obtiene a

partir de la prueba del cociente de verosimilitud (p=0.3916) al pedir la comparación de

los modelos como se mostró en la sección Análisis de un modelo ajustado.

Comparación de modelos df AIC BIC logLik Test L.Ratio p-value modelo001_Biomasa_REML 14 161.03 177.52 -66.52

modelo002_Biomasa_REML 17 164.03 184.06 -65.02 1 vs 2 3.00 0.3916

Por este motivo, nos quedamos con el modelo homoscedástico y, debido a la presencia

de interacción entre los dos factores, se realiza un diagrama de puntos para visualizar el

comportamiento de las medias de biomasa de lombrices (Figura 118).


179

Figura 118: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su efecto sobre la biomasa. Datos archivo Lombrices.IDB2.

Como se puede observar, este gráfico sugiere la presencia de un comportamiento lineal

para sol y uno cuadrático para los otros tratamientos. Para probar estas hipótesis se

realizan contrastes ortogonales polinómicos a partir de la solapa Comparaciones,

subsolapa Contrastes (Figura 119).

Sol SombraL1 SombraL2 SombraNL

1 2 3Profundidad

20

30

40

50

60

70

80

90

Biom

asa

Sol SombraL1 SombraL2 SombraNL


180

Figura 119: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo mixto con los datos del archivo Lombrices.IDB2.

A continuación se muestran los resultados de los contrastes. Se puede ver que el único

tratamiento que presenta solo tendencia lineal y no cuadrática es el de sol (p<0.0001 y

p=0.8147 respectivamente). El resto de los tratamientos, además de la tendencia lineal,

presentan una tendencia cuadrática.

Pruebas de hipótesis para contrastes Tratam*Profund F gl(num) gl(den) p-valor Cont.1 111.81 1 24 <0.0001 Cont.2 0.06 1 24 0.8147 Cont.3 222.11 1 24 <0.0001 Cont.4 26.66 1 24 <0.0001 Cont.5 164.40 1 24 <0.0001 Cont.6 10.52 1 24 0.0035 Cont.7 92.62 1 24 <0.0001 Cont.8 7.26 1 24 0.0127 Total 79.43 8 24 <0.0001


181

Coeficientes de los contrastes Tratam Profund Cont.1 Cont.2 Cont.3 Cont.4 Cont.5 Cont.6 Cont.7 Cont.8 sol 1 -1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 sol 2 0.00 -2.00 0.00 0.00 0.00 0.00 0.00 0.00 sol 3 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 sombraL1 1 0.00 0.00 -1.00 1.00 0.00 0.00 0.00 0.00 sombraL1 2 0.00 0.00 0.00 -2.00 0.00 0.00 0.00 0.00 sombraL1 3 0.00 0.00 1.00 1.00 0.00 0.00 0.00 0.00 sombraL2 1 0.00 0.00 0.00 0.00 -1.00 1.00 0.00 0.00 sombraL2 2 0.00 0.00 0.00 0.00 0.00 -2.00 0.00 0.00 sombraL2 3 0.00 0.00 0.00 0.00 1.00 1.00 0.00 0.00 sombraNL 1 0.00 0.00 0.00 0.00 0.00 0.00 -1.00 1.00 sombraNL 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 -2.00 sombraNL 3 0.00 0.00 0.00 0.00 0.00 0.00 1.00 1.00


182

Diseños de testigos apareados

Este tipo de arreglo de tratamientos es común en la evaluación de nuevos cultivares

(variedades, híbridos, etc.) en mejoramiento genético vegetal. Básicamente consisten en

ubicar en forma aleatoria el conjunto de cultivares a evaluar intercalando siempre entre

ellos un testigo común. La presencia de este testigo es la que permite de alguna forma

modelar los efectos sistemáticos de la calidad del terreno donde se ubican las parcelas

experimentales. Para ejemplificar su análisis se presenta un ejemplo con 16 híbridos

(H1,…, H16) y un testigo, y así se tiene un total de 32 unidades experimentales. Los

datos se encuentran en el archivo Testigos apareados.IDB2.

Una alternativa básica y muy poco eficiente para analizar estos datos es realizar un

ANOVA a una vía de clasificación, y comparar los tratamientos usando una estimación

del término de error a partir de la varianza entre los testigos (únicos niveles del factor

tratamiento que están repetidos). Este modelo es incapaz de contemplar los sesgos

producidos por las diferencias sistemáticas entre unidades experimentales. Para obtener

este modelo, se declara en el selector de variables a Rendimiento como variable

dependiente y a Hibrido como variable de clasificación.

En la solapa de Efectos fijos se declara al Hibrido como en la Figura 120. Luego, en la

solapa Comparaciones se solicitó la prueba LSD de Fisher para Hibrido.

http://dl.dropbox.com/u/65302225/Datos/Testigos_apareados.IDB2�


183

Figura 120: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2.

La salida correspondiente se presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo000_Rendimiento_REML<-gls(Rendimiento~1+Hibrido ,method="REML" ,na.action=na.omit ,data=R.data21) Resultados para el modelo: modelo000_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 219.90 232.64 -91.95 101.35 0.69 AIC y BIC menores implica mejor


184

Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 3580.56 <0.0001 Hibrido 16 2.12 0.0763 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H4 1230.00 101.35 A H3 1222.00 101.35 A H14 1193.00 101.35 A B H10 1168.00 101.35 A B C H11 1116.00 101.35 A B C Testigo 1115.81 25.34 A B C H5 1099.00 101.35 A B C H9 1063.00 101.35 A B C H2 1037.00 101.35 A B C D H12 1033.00 101.35 A B C D H8 975.00 101.35 A B C D H7 966.00 101.35 A B C D H16 928.00 101.35 A B C D H6 907.00 101.35 B C D H1 886.00 101.35 C D H13 876.00 101.35 C D H15 756.00 101.35 D Letras distintas indican diferencias significativas(p<= 0.05)

La prueba F para Hibrido no resultó significativa (p = 0.0763) por lo cual no deben

interpretarse las diferencias de medias presentadas en la prueba LSD de Fisher.

La alternativa a este modelo es el uso de correlaciones espaciales para corregir las

medias de cada híbrido por el “efecto del sitio” en donde fueron ubicadas por azar. Para

esto, se procede a colocar la Posicion de la parcela como una covariable.

En la solapa Efectos fijos se deja igual que en la Figura 120. En la solapa Correlación se

especifican los diferentes modelos:

Modelo 1: Correlación espacial exponencial ( Figura 121).

Modelo 2: Correlación espacial Gaussiana (Figura 122).

Modelo 3: Correlación espacial lineal (Figura 123).

Modelo 4: Correlación espacial “rational quadratic” (Figura 124).

Modelo 5: Correlación espacial esférica (Figura 125).


185

A continuación se muestran las ventanas de selección de correlación espacial y las

medidas de ajuste de cada uno de los modelos estimados.

Figura 121: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial exponencial.



186

Figura 122: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial Gaussiana.



187

Figura 123: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial lineal.



188

Figura 124: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial “rational quadratic”.



189

Figura 125: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y selección de Correlación espacial esférica.


Todos los modelos ajustan bien, ya que sus valores de AIC y BIC son muy parecidos. El

modelo con menores valores es el de Correlación espacial exponencial (AIC=218.62,

BIC=232.08). La salida correspondiente a este modelo se presenta a continuación.


190

Modelos lineales generales y mixtos Especificación del modelo en R modelo028_Rendimiento_REML<-gls(Rendimiento~1+Hibrido ,correlation=corExp(form=~as.numeric(as.character(Posicion)) ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data28) Resultados para el modelo: modelo028_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 218.62 232.08 -90.31 112.79 0.58 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 582.79 <0.0001 Hibrido 16 5.27 0.0012 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(Posicion)) Metrica: euclidean Parámetros del modelo Parámetro Estim range 2.74 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H3 1248.31 85.33 A H4 1244.19 85.33 A H10 1145.64 85.33 A B H5 1128.65 85.33 A B C Testigo 1096.98 45.09 A B C H2 1091.07 85.33 A B C H11 1078.43 85.33 A B C H9 1078.28 85.33 A B C H14 1070.07 85.33 A B C H1 1005.46 85.33 B C H12 979.80 85.33 B C H6 966.31 85.33 B C


191

H7 936.21 85.33 B C D H8 933.40 85.33 B C D H16 902.87 85.33 C D H13 727.55 85.33 D E H15 653.36 85.33 E Letras distintas indican diferencias significativas(p<= 0.05)

Se encontraron diferencias entre híbridos (p = 0.0012). Mediante la prueba LSD de

Fisher de comparación de medias se pudo determinar que los híbridos de mayor

rendimiento fueron los H2, H3, H4, H5, H9, H10, H11, H14, y que éstos a su vez no

difieren del testigo.

Otra alternativa es pensar el problema como en los orígenes de la modelación espacial

(Papadakis 1937), y utilizar un análisis de covarianza para ajustar las medias de los

híbridos en las distintas posiciones. Para realizar una aproximación a este tipo de

análisis se construyó una nueva variable llamada Tes, la cual contiene los rendimientos

correspondientes a los testigos, luego se adicionó una nueva columna (Hib) en la que se

copiaron los valores del rendimiento del hibrido más cercano a cada testigo. Se calculó

luego la diferencia del rendimiento del testigo frente al hibrido (Dif).

A continuación se realizó un análisis de regresión lineal considerando a Dif como

variable dependiente y a Posicion como variable regresora. Se guardaron los predichos

de este modelo con el fin de utilizarlos como una covariable en el análisis de las medias

de híbridos.

Luego, en la ventana del selector de variables de Modelos lineales generalizados y

mixtos se declaran las variables como se muestra en la Figura 126.


192

Figura 126: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Testigos_apareados.IDB2.

En la ventana de Efectos fijos se declara a Hibrido y a PRED_Dif. En la solapa

Comparaciones se solicitó la prueba LSD de Fisher. La salida correspondiente se

presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo029_Rendimiento_REML<-gls(Rendimiento~1+Hibrido+PRED_Dif ,method="REML" ,na.action=na.omit ,data=R.data29) Resultados para el modelo: modelo029_Rendimiento_REML Variable dependiente:Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 32 215.09 227.23 -88.54 79.89 0.82 AIC y BIC menores implica mejor


193

Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 5763.58 <0.0001 Hibrido 16 3.42 0.0129 PRED_Dif 1 10.15 0.0066 Medias ajustadas y errores estándares para Hibrido LSD Fisher (alfa=0.05) Procedimiento de correccion de p-valores: No Hibrido Medias E.E. H4 1295.07 82.46 A H3 1293.92 83.02 A H10 1150.88 80.07 A B H5 1143.52 81.10 A B H2 1129.47 85.00 A B H14 1121.08 83.02 A B Testigo 1115.81 19.97 A B H11 1078.33 80.76 A B H9 1052.73 79.95 A B C H12 988.48 81.10 B C H1 985.32 85.76 B C H8 985.27 79.95 B C H7 983.12 80.07 B C H6 944.67 80.76 B C H16 828.68 85.76 C D H13 810.93 82.46 C D H15 663.53 85.00 D Letras distintas indican diferencias significativas(p<= 0.05)

Si bien se llega a la misma conclusión con respecto a los cultivares que en el análisis

usando correlación espacial exponencial, podemos observar que las medias ajustadas y

los errores estándares son diferentes. También difiere el orden o ranking presente entre

los híbridos que presentan los mayores rendimientos. Por último, el contemplar la

correlación espacial es una alternativa mucho más sencilla para realizar este tipo de

análisis.


194

Aplicaciones en regresión lineal

Regresión con coeficientes aleatorios

En este ejemplo se está evaluando el aprendizaje de estudiantes de matemáticas en sexto

grado. Ocho maestros se seleccionaron aleatoriamente para participar del estudio. Al

comenzar el año académico, los estudiantes de los maestros participantes tomaron una

prueba diagnóstica (pre-prueba) con contenidos matemáticos de sexto grado. Al

finalizar el año los mismos estudiantes tomaron una prueba (post-prueba) evaluando los

mismos contenidos (Cáceres et ál., 2011).

Cada maestro tenía entre 10 y 30 estudiantes, y algunos estudiantes completaron la pre-

prueba pero no la post-prueba. Se desea estudiar si hay relación entre la ganancia de

aprendizaje (diferencia entre la calificación de la post-prueba y la calificación de la pre-

prueba) y la calificación de la pre-prueba. Si graficamos esta relación usando los datos

del archivo Ganancia en Aprendizaje.IDB2, se puede observar una relación negativa

entre ganancia y resultado de la pre-prueba. Además, agregando una línea suavizada

para los datos de cada maestro se puede apreciar que las tendencias son

aproximadamente lineales, y que los parámetros de estas líneas varían de maestro a

maestro (Figura 127):

Figura 127: Relación entre la Ganancia en aprendizaje y la Calificacion previa al entrenamiento suavizada para cada uno de los maestros. Archivo Ganancia en aprendizaje.IDB2.

0 15 30 45 60 75Calificacion Pre

-45

-30

-15

0

15

30

45

60

75

Gan

anci

a

http://dl.dropbox.com/u/65302225/Datos/Ganancia%20en%20Aprendizaje.IDB2�


195

Para ajustar un modelo en InfoStat que describa estos datos se debe recordar que los

maestros han sido escogidos aleatoriamente, por lo que la variabilidad entre las líneas es

aleatoria. Un modelo apropiado para estos datos es el de una regresión lineal simple con

efectos aleatorios para el intercepto y la pendiente. Estos efectos aleatorios claramente

deben estar correlacionados (en términos generales, si la pendiente aumenta el

intercepto debería disminuir para que los datos se mantengan en la nube de datos

observada). Por lo tanto el modelo se debe especificar en InfoStat de manera tal que sea

posible incorporar efectos aleatorios de intercepto y pendiente que puedan estar

correlacionados. Para ello, en la ventana de selección de variables para Modelos lineales

generales y mixtos se declara a Ganancia como variable, a Maestro como criterio de

clasificación y a Calificacion.Pre como covariable en la primera ventana). Luego, en la

solapa Efectos fijos se declara Calificacion.Pre y además se agrega la definición

explícita del intercepto (para poder luego declarar ambos como efectos aleatorios). El

intercepto se declara agregando un 1 en la solapa de Efectos fijos (Figura 128). También

se debe marcar la opción de Coeficientes de los efectos fijos para obtener la ecuación de

la línea recta promedio.


196

Figura 128: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo Ganancia en aprendizaje.IDB2.

La especificación de los efectos aleatorios se realiza agregando Maestro como criterio

de estratificación, e indicando que este efecto es sobre 1+Calificacion.Pre (es decir, hay

efecto aleatorio de maestro sobre el intercepto y sobre la pendiente) (Figura 129).

Además, al indicar pdSymm se están especificando varianzas diferentes para el efecto

del intercepto y de la pendiente (obvio dada la naturaleza diferente de ambos

parámetros) y correlación entre ambos efectos aleatorios.


197

Figura 129: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del archivo Ganancia en aprendizaje.IDB2.

La salida correspondiente a este modelo presenta, además de las partes usuales en

modelos mixtos, los coeficientes de la recta promedio, ˆ 30.13 0.81Y x= − . Como se

esperaba, a medida que la calificación en la pre-prueba es mayor, la ganancia

disminuye. Se puede observar además la alta correlación entre los efectos de maestros

sobre intercepto y pendiente (-0.876), que confirma la necesidad de incorporar este

parámetro al modelo.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.002_Ganancia_REML<-lme(Ganancia~1+Calificacion.Pre random=list(Maestro=pdSymm(~1+Calificacion.Pre)) method="REML"


198

control=lmeControl(msMaxIter=200) na.action=na.omit data=R.data02 keep.data=FALSE) Resultados para el modelo: modelo.002_Ganancia_REML Variable dependiente: Ganancia Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1_ 184 1485.954 1505.178 -736.977 13.1736 0.339 0.366 AIC y BIC menores implica mejor Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 175 29.007004 <0.0001 Calificacion.Pre 1 175 78.129020 <0.0001 Efectos fijos Value Std.Error DF t-value p-value (Intercept) 30.132848 2.943507 175 10.237058 <0.0001 Calificacion.Pre -0.810821 0.091732 175 -8.839062 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdSymm Formula: ~1 + Calificacion.Pre|Maestro Desvíos estándares relativos al residual y correlaciones (const) Calificacion.Pre (const) 0.200769 -0.875547 Calificacion.Pre -0.875547 0.008462

Regresion heteroscedástica

En un trabajo para evaluar la productividad primaria en pasturas y su relación con la

precipitación, se evaluaron nueve potreros, cinco con pastura semi-natural y cuatro con

pasturas sembradas. La productividad primaria en periodos de 22 días de crecimiento se

midió varias veces a lo largo del año en cada potrero (la mayoría de los potreros 12

veces). Paralelamente, se registraban los milímetros de lluvia caídos en el periodo de

crecimiento de 22 días (Ospina 2011, Ospina et ál. 2012). Los datos se encuentran en el

archivo Productividad primaria.IDB2. Para realizar un análisis de regresión con tipo de

pastura como variable clasificatoria, en la ventana de selección de variables del módulo

Modelos lineales generales y mixtos, declaramos las variables como en la Figura 130.

http://dl.dropbox.com/u/65302225/Datos/Productividad%20primaria.IDB2�


199

Figura 130: Ventana de selección de variables del módulo Modelos lineales generales para los datos del archivo Productividad primaria.IDB2.

En la solapa Efectos fijos declaramos las variables como en la Figura 131 y en la de

efectos aleatorios declaramos a Potrero (Figura 132). Con estas especificaciones del

modelo de regresión ajustamos un modelo de regresión con dos interceptos (ordenadas

al origen) y un efecto aleatorio de potrero. Los residuos obtenidos luego de ajustar este

modelo se usan para diagnosticar posibles problemas en el ajuste y los supuestos. Como

se puede observar en el resumen de gráficos de diagnostico que se presentan en la

Figura 133 se puede ver que el Q-Q-plot muestra que la distribución de los residuos es

aproximadamente normal, pero los diagramas de dispersión de Residuos condicionales

de Pearson versus PPacum muestran una racha de valores residuos negativos después

del los 300 mm. Esta misma racha se observa en el diagrama de dispersión de Residuos

condicionales de Pearson versus los Valores ajustados, en este caso por encima de los

110 g/m2 de productividad primaria.


200

Figura 131: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del archivo Productividad primaria.IDB2.

Figura 132: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los datos del archivo Productividad primaria.IDB2.


201

Figura 133: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2 con la variable PPacum como regresora y pastura como factor fijo.

Esto sugiere la necesidad de incluir un término cuadrático para la variable regresora

PPacum. Para esto, en el menú Datos, sub-menú Transformaciones se eligió a PPacum

como variable, y luego de aceptar se pidió una transformación de potencia (en este caso

de orden 2) y esto generó una nueva variable en la base de datos llamada POT_PPacum.

Se agrego esta variable como covariable en el selector de variables de Modelos lineales

generales y mixtos y posteriormente, se la declaró en la solapa Efectos fijos del modelo

junto a las otras variables que ya estaban ingresadas como se indicó en la Figura 142. La

solapa de Efectos aleatorios, se la deja como en la Figura 132. Al aceptar y solicitar

nuevamente el diagnóstico de los residuos, obtendremos los gráficos que se presentan

en la Figura 134.


202

Figura 134: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2 con la variable PPacum y POT_PPacum como regresoras y pastura

como factor fijo.

Analizando el diagrama de dispersión de residuos condicionales de Pearson versus los

Valores ajustados, se observa una clara tendencia de los residuos a aumentar su varianza

a medida que aumenta el valor medio. Esto sugiere la necesidad de modelar esta falta de

homogeneidad de varianza con una función que relaciones las varianzas de los residuos

con la media. Para declarar esta función, realizamos nuevamente el análisis (recordemos

que Ctrl + r repite el último comando) y en la solapa Heteroscedasticidad declaramos

VarPower como se muestra en la Figura 135.


203

Figura 135: Ventana del módulo Modelos lineales generales con la solapa Heteroscedasticidad desplegada para los datos del archivo Productividad primaria.IDB2 y la selección de la función

VarPower.

Luego se repitió este análisis para otras dos funciones de varianzas, VarExp y

VarConstPower. A continuación se presentan los resultados de los estadísticos de ajuste

para estos tres modelos:

VarExp


VarPower



204

VarConstPower


No podemos comparar estos modelos usando un cociente de verosimilitud (LRT) ya que

no forman un conjunto anidado de hipótesis (excepto VarPower y VarConstPower). En

estos casos sólo los criterios AIC y BIC son útiles. El modelo VarPower resulta ser el

mejor para declarar las varianzas heterogéneas. Luego de ajustar este modelo, los

residuos no presentan ninguna tendencia (Figura 136).

Figura 136: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2 con la variable PPacum y POT_PPacum como regresoras, pastura como

factor fijo y una función VarPower para las varianzas heterogéneas.

Para probar las hipótesis de igualdad de tendencias lineales y cuadráticas se incluyeron

en el modelo las interacciones entre tipo de pastura y las dos variables regresoras


205

(Figura 137). El efecto aleatorio de potrero fue declarado en la solapa Efectos aleatorios

(Figura 138) y la heteroscedasticidad fue especificada como en la Figura 135.

Figura 137: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del archivo Productividad primaria.IDB2 y la especificación del modelo con interacción.


206

Figura 138: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los datos del archivo Productividad primaria.IDB2 y la selección del efecto de potrero

como aleatorio.

Con estas especificaciones se logró la siguiente salida.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.002_Productividad.primaria_REML<-lme(Productividad.primaria~1+Pastura+PPacum+POT_PPacum+Pastura:PPacum+Pastura:POT_PPacum ,random=list(Potreros=pdIdent(~1)) ,weights=varComb(varPower(form=~fitted(.))) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data02 ,keep.data=FALSE) Resultados para el modelo: modelo.002_Productividad.primaria_REML Variable dependiente: Productividad.primaria Medidas de ajuste del modelo


207

N AIC BIC logLik Sigma R2_0 R2_1 104 1004.89 1028.15 -493.45 2.46 0.65 0.65 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 91 0.32 0.5703 Pastura 1 7 12.62 0.0093 PPacum 1 91 167.15 <0.0001 POT_PPacum 1 91 55.66 <0.0001 Pastura:PPacum 1 91 4.19 0.0435 Pastura:POT_PPacum 1 91 0.01 0.9179 Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 91 152.56 <0.0001 Pastura 1 7 34.31 0.0006 PPacum 1 91 184.34 <0.0001 POT_PPacum 1 91 62.10 <0.0001 Pastura:PPacum 1 91 21.04 <0.0001 Pastura:POT_PPacum 1 91 0.01 0.9179 Efectos fijos Value Std.Error DF t-value p-value (Intercept) -9.44 2.74 91 -3.45 0.0009 PasturaSemi-naturales 16.27 4.58 7 3.55 0.0093 PPacum 0.82 0.08 91 9.90 <0.0001 POT_PPacum -1.1E-03 2.2E-04 91 -4.93 <0.0001 PasturaSemi-naturales:PPac.. -0.23 0.11 91 -2.05 0.0435 PasturaSemi-naturales:POT_.. 2.9E-05 2.8E-04 91 0.10 0.9179 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Potreros Desvíos estándares y correlaciones (const) (const) 1.3E-03 Estructura de varianzas Modelo de varianzas: varPower Formula: ~ fitted(.) Parámetros de la función de varianza Parámetro Estim power 0.60


208

Como se puede observar en la salida anterior, existe interacción pastura con PPacum, lo

que indica que el comportamiento lineal es diferente entre las pasturas. Por otra parte,

no existe un comportamiento diferente entre las pasturas para la componente cuadrática

de la regresión, por lo ésta es similar en las dos pasturas. Por este motivo se corrió

nuevamente el modelo eliminando de la parte fija el efecto de la interacción

Pastura*POT_PPacum, y la salida resultante se presenta a continuación.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.003_Productividad.primaria_REML<-lme(Productividad.primaria~1+Pastura+PPacum+POT_PPacum+Pastura:PPacum ,random=list(Potreros=pdIdent(~1)) ,weights=varComb(varPower(form=~fitted(.))) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data03 ,keep.data=FALSE) Resultados para el modelo: modelo.003_Productividad.primaria_REML Variable dependiente: Productividad.primaria Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 104 988.37 1009.14 -486.19 2.46 0.65 0.65 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 92 0.35 0.5579 Pastura 1 7 17.01 0.0044 PPacum 1 92 171.84 <0.0001 POT_PPacum 1 92 57.67 <0.0001 Pastura:PPacum 1 92 21.17 <0.0001 Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 92 154.21 <0.0001 Pastura 1 7 33.77 0.0007 PPacum 1 92 186.37 <0.0001 POT_PPacum 1 92 63.32 <0.0001 Pastura:PPacum 1 92 21.17 <0.0001


209

Efectos fijos Value Std.Error DF t-value p-value (Intercept) -9.34 2.47 92 -3.78 0.0003 PasturaSemi-naturales 16.00 3.88 7 4.12 0.0044 PPacum 0.82 0.06 92 13.60 <0.0001 POT_PPacum -1.0E-03 1.4E-04 92 -7.59 <0.0001 PasturaSemi-naturales:PPac.. -0.21 0.05 92 -4.60 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Potreros Desvíos estándares y correlaciones (const) (const) 2.2E-03 Estructura de varianzas Modelo de varianzas: varPower Formula: ~ fitted(.) Parámetros de la función de varianza Parámetro Estim power 0.60 Medias ajustadas y errores estándares para Pastura LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Pastura Medias E.E. Sembradas 70.01 4.58 A Semi-naturales 56.17 3.52 B Medias con una letra común no son significativamente diferentes(p<= 0.05)

Debido a la presencia de la regresión polinomica, es más adecuado reportar las sumas

de cuadrado secuenciales (tipo I). Podemos decir que existe un efecto de pastura

(p=0.0007) siendo las pasturas sembradas las que más productividad primaria promedio

presentan (70 contra 56.17). La productividad primaria responden a la precipitación

acumulada, PPacum (p<0.0001) con una tendencia cuadrática, POT_PPacum

(p<0.0001). La tendencia lineal es diferente entre las pasturas ya que la interacción

Pastura*PPacum fue significativa (p<0.0001). El diagrama de dispersíon entre

Productividad primaria y Precipitaciones acumuladas con un suvizado polinomico de

orden 2 muestra estas tendencias (Figura 139).


210

Figura 139: Diagrama de dispersión mostrando la relación entre productividad primaria y precipitación acumulada para cada una de las pasturas. Archivo productividad primaria.IDB2.

Debido a la interacción existente, no es posible interpretar las medias ajustadas. Para

comparar ambas pasturas en distintos niveles de precipitación se puede usar el menú de

Exploración de Modelo, solapa de Combinaciones Lineales. Para determinar los

coeficientes, consideremos el siguiente ejemplo. Para probar si hay diferencias entre

pasturas con precipitación acumulada de 100 mm la hipótesis nula puede escribirse

como:

0 0 1 2 0 1 2 1: 100 10000 100 10000 100H β β β β α β β αβ+ + = + + + +

Esta hipótesis es equivalente a 0 1: 100 0H α αβ+ = , que es una combinación lineal de

los parámetros del modelo. Los coeficientes para valores de precipitación de 100 mm,

300 mm y 500 mm se muestran en la ventana correspondiente en la Figura 140.

SembradasSemi-naturales

0 50 100 150 200 250 300 350 400 450 500 550 600Precipitaciones acumuladas

0

20

40

60

80

100

120

140

160

180

200

Prod

uctiv

idad

prim

aria

SembradasSemi-naturales


211

Figura 140: Ventana Exploración de modelos estimados con la solapa Combinaciones lineales desplegada. Archivo productividad primaria.IDB2.

Pruebas de hipótesis para combinaciones lineales Comb. lineal Estimación E.E. gl F p-valor Comb.1 -5.48 4.25 1 1.66 0.2008 Comb.2 -48.44 12.45 1 15.14 0.0002 Comb.3 -91.40 21.59 1 17.92 0.0001 Total sd sd

Los resultados indican que no hay diferencias significativas entre pasturas cuando la

precipitación es de 100 mm (p=0.2008), mientras que cuando la precipitación es de 300

mm o de 500 mm la pastura sembrada tiene mayor productividad primaria (p=0.0002 y

p=0.0001 respectivamente).


212

Bloques incompletos y diseños relacionados

Diseños Alfa látices

Los datos de este ejemplo provienen de un ensayo de 18 variedades de cebada realizado

en Escocia (Patterson et ál., 1989). Debido a la cantidad de tratamientos fue imposible

reunir bloques con 18 unidades experimentales homogéneas, por los que estos eran

incompletos. Una repetición completa de este experimento consiste de tres bloques

incompletos con cuatro unidades experimentales cada y dos bloques incompletos con

tres unidades experimentales cada uno, y se contó con un total de cuatro repeticiones

(Figura 141).

1

11

1

3

1

8

1

10

2

13

2

17

2

16

2

5

3

14

3

18

3

4

4

6

4

1

4

7

4

12

5

9

5

2

5

15

I

1

15

1

4

1

11

1

17

2

5

2

12

2

10

3

9

3

1

3

13

4

2

4

14

4

7

4

8

5

16

5

6

5

3

5

18

II

1

12

1

15

1

3

2

4

2

16

2

7

3

8

3

4

3

12

3

13

4

18

4

8

4

5

4

9

5

10

5

17

5

14

5

1

III

1

10

1

2

1

16

2

9

2

17

2

7

2

3

3

8

3

4

3

12

3

13

4

15

4

6

4

5

4

14

5

11

5

1

5

18

IV

Figura 141: Diagrama del diseño de experimento para el ensayo de 18 variedades de cebada conducido

como un alfa látice. Los número romanos a la derecha indican las repeticiones, los número arabicos en la parte superior de la celda indican los bloques incompletos (de tamaños 4 y 3) y en la parte

inferior las variedades.

Comenzaremos analizando este experimento considerando solamente las repeticiones

como un gran bloque (completo). Ya que hay cuatro repeticiones se puede estimar un

término de error para realizar las comparaciones de variedades. Los datos se encuntran

en el archivo Alfa látice.IDB2.

En la ventana de selección de variables de Modelos generales y mixtos declaramos

Rendimiento como variable, Variedad, Bloque incompleto y Repeticion como criterios

de clasificación. Luego de aceptar, en la solapa de Efectos fijos se declara Variedad

(Figura 142), y en la solapa Efectos aleatorios se declara Repeticion (Figura 143).

http://dl.dropbox.com/u/65302225/Datos/Alfa%20latice.IDB2�


213

Como todas las variedades están en cada repetición, esta forma de declarar el modelo

corrige los sesgos por repeticiones, aunque ignora el efecto (y por ende los sesgos)

debidos a los bloques incompletos.

Figura 142: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos identificando a las variedades para los datos del archivo Alfa látice.IDB2.


214

Figura 143: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando a las repeticiones para los datos del archivo Alfa látice.IDB2.

La siguiente salida presenta los resultados para este modelo. Modelos lineales generales y mixtos Especificación del modelo en R modelo.017_Rendimiento_REML<-lme(Rendimiento~1+Variedad ,random=list(Repeticion=pdIdent(~1)) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data17 ,keep.data=FALSE) Resultados para el modelo: modelo.017_Rendimiento_REML Variable dependiente: Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 72 65.2834 105.0631 -12.6417 0.2237 0.3714 0.7015 AIC y BIC menores implica mejor


215

Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 51 1977.3627 <0.0001 Variedad 17 51 3.7389 0.0001 Efectos fijos Value Std.Error DF t-value p-value (Intercept) 5.3250 0.1579 51 33.7330 <0.0001 Variedad10 -0.6750 0.1582 51 -4.2673 0.0001 Variedad11 -0.2000 0.1582 51 -1.2644 0.2118 Variedad12 -0.4750 0.1582 51 -3.0029 0.0041 Variedad13 -0.3250 0.1582 51 -2.0546 0.0451 Variedad14 0.0000 0.1582 51 0.0000 >0.9999 Variedad15 -0.0500 0.1582 51 -0.3161 0.7532 Variedad16 -0.2250 0.1582 51 -1.4224 0.1610 Variedad17 0.1750 0.1582 51 1.1063 0.2738 Variedad18 -0.4750 0.1582 51 -3.0029 0.0041 Variedad2 -0.4250 0.1582 51 -2.6868 0.0097 Variedad3 -0.0750 0.1582 51 -0.4741 0.6374 Variedad4 -0.0500 0.1582 51 -0.3161 0.7532 Variedad5 -0.3750 0.1582 51 -2.3707 0.0216 Variedad6 -0.3250 0.1582 51 -2.0546 0.0451 Variedad7 -0.2000 0.1582 51 -1.2644 0.2118 Variedad8 -0.4000 0.1582 51 -2.5288 0.0146 Variedad9 -0.1250 0.1582 51 -0.7902 0.4330 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Repeticion Desvíos estándares y correlaciones (const) (const) 0.2228 Medias ajustadas y errores estándares para Variedad LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Variedad Medias E.E. 17 5.5000 0.1579 A 14 5.3250 0.1579 A B 1 5.3250 0.1579 A B 15 5.2750 0.1579 A B C 4 5.2750 0.1579 A B C 3 5.2500 0.1579 A B C D 9 5.2000 0.1579 A B C D E 11 5.1250 0.1579 B C D E F 7 5.1250 0.1579 B C D E F 16 5.1000 0.1579 B C D E F 6 5.0000 0.1579 C D E F 13 5.0000 0.1579 C D E F 5 4.9500 0.1579 D E F G 8 4.9250 0.1579 E F G 2 4.9000 0.1579 E F G 18 4.8500 0.1579 F G 12 4.8500 0.1579 F G 10 4.6500 0.1579 G Medias con una letra común no son significativamente diferentes(p<= 0.05)

Como se puede observar la comparación de medias se realiza usando un único error

estándar (el error estándar de los efectos estimados de tratamiento, 0.1582, representa el


216

error estándar entre cada tratamiento y el tratamiento de referencia). Ahora realizaremos

un nuevo análisis incorporando el efecto de los Bloques incompletos. Para esto dejamos

la solapa de Efectos fijos como en la Figura 142 (solo Variedad) y en la solapa Efectos

aleatorios declaramos a Repeticion y Bloque incompleto como se muestra en la Figura

144.

Figura 144: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando los efectos de repetición y bloque incompleto dentro de repetición para los datos del

archivo Alfa látice.IDB2.

A continuación se presenta la salida correspondiente a este modelo.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.018_Rendimiento_REML<-lme(Rendimiento~1+Variedad ,random=list(Repeticion=pdIdent(~1) ,Bloque.incompleto=pdIdent(~1)) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit


217

,data=R.data18 ,keep.data=FALSE) Resultados para el modelo: modelo.018_Rendimiento_REML Variable dependiente: Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 72 52.3497 94.1184 -5.1749 0.1532 0.3431 0.6595 0.8961 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 35 2154.5072 <0.0001 Variedad 17 35 6.5359 <0.0001 Efectos fijos Value Std.Error DF t-value p-value (Intercept) 5.3617 0.1381 35 38.8237 <0.0001 Variedad10 -0.7408 0.1217 35 -6.0875 <0.0001 Variedad11 -0.1617 0.1196 35 -1.3518 0.1851 Variedad12 -0.4320 0.1217 35 -3.5499 0.0011 Variedad13 -0.3867 0.1196 35 -3.2327 0.0027 Variedad14 -0.1252 0.1209 35 -1.0362 0.3072 Variedad15 -0.0681 0.1254 35 -0.5434 0.5903 Variedad16 -0.2194 0.1254 35 -1.7500 0.0889 Variedad17 0.1129 0.1201 35 0.9399 0.3537 Variedad18 -0.5234 0.1203 35 -4.3502 0.0001 Variedad2 -0.4471 0.1251 35 -3.5731 0.0011 Variedad3 -0.0913 0.1244 35 -0.7338 0.4680 Variedad4 -0.1055 0.1251 35 -0.8439 0.4045 Variedad5 -0.4646 0.1243 35 -3.7381 0.0007 Variedad6 -0.3397 0.1201 35 -2.8289 0.0077 Variedad7 -0.1896 0.1210 35 -1.5668 0.1261 Variedad8 -0.5895 0.1238 35 -4.7632 <0.0001 Variedad9 -0.2701 0.1204 35 -2.2438 0.0313 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Repeticion Desvíos estándares y correlaciones (const) (const) 0.2011 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque.incompleto Dentro Repeticion Desvíos estándares y correlaciones (const) (const) 0.1757


218

Medias ajustadas y errores estándares para Variedad LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Variedad Medias E.E. 17 5.4746 0.1372 A 1 5.3617 0.1381 A B 15 5.2936 0.1381 A B C 3 5.2704 0.1377 A B C 4 5.2562 0.1381 A B C D 14 5.2365 0.1377 A B C D 11 5.2000 0.1377 B C D E 7 5.1722 0.1377 B C D E F 16 5.1423 0.1381 B C D E F G 9 5.0916 0.1381 C D E F G 6 5.0220 0.1372 D E F G H 13 4.9750 0.1377 E F G H I 12 4.9297 0.1381 F G H I 2 4.9146 0.1381 G H I 5 4.8971 0.1377 G H I 18 4.8383 0.1381 H I J 8 4.7722 0.1372 I J 10 4.6210 0.1381 J Medias con una letra común no son significativamente diferentes(p<= 0.05)

En la salida anterior se puede apreciar que los errores estándar de las diferencias (igual

al error estándar de los efectos de variedad) siguen siendo similares para cada variedad

aunque no iguales, ya que a pesar de que todas las variedades tienen el mismo número

de repeticiones, n=4, los bloques incompletos son de distinto tamaño (tres o cuatro

unidades experimentales). Sin embargo, estos errores estándar son más pequeños que en

el modelo anterior, debido a que ahora se ha descontado la varianza de los bloques

dentro de cada repetición. A su vez, las medias de este último análisis están corregidas

por el efecto de bloque (medias ajustadas) por lo que este análisis es mejor ya que las

medias estimadas son insesgadas (condicionalmente a los bloques observados). Se

puede notar que el ranking de medias ha cambiado, en el análisis con solo efectos de

repeticiones (como si fuera un DBCA) las tres medias ordenadas en forma decreciente

fueron las de variedad 17, 14 y 1, mientras que en el análisis considerando también

bloques incompletos (DBI) fueron la 17, 1 y 15.

El error estándar de la diferencia de dos medias en el primer análisis fue de 0.158 y el

del segundo fue de 0.122 en promedio (para calcular el promedio de los errores estándar

de las diferencias, el procedimiento usual es elevar al cuadrado cada error estándar,

promediar estos valores y luego tomar la raíz cuadrada de este promedio). La eficiencia

de este modelo con respecto al anterior se puede calcular como:


219

22

2

0.158 1.680.122

DifDBCA

DifDBI

Eficienciaσσ

= = =

Es decir, el modelo que considera los bloques incompletos dentro de las repeticiones es

un 68% más eficiente que el modelo que considera solo las repeticiones como en un

DBCA.

A continuación se presenta la síntesis de las medidas de ajuste de los dos modelos,

donde los criterios AIC y BIC sugieren que el BIC es el mejor modelo.

Modelo incluyendo bloques incompletos

N AIC BIC logLik Sigma R2_0 R2_1 R2_2 72 52.3497 94.1184 -5.1749 0.1532 0.3431 0.6595 0.8961 AIC y BIC menores implica mejor

Modelo sin incluir bloques incompletos

N AIC BIC logLik Sigma R2_0 R2_1 72 65.2834 105.0631 -12.6417 0.2237 0.3714 0.7015 AIC y BIC menores implica mejor


220

Diseño fila-columna latinizado

Los datos de este ejemplo provienen de un ensayo para evaluar 30 variedades de

algodón. Cada una de las variedades se repitió 5 veces (William 1986). En la Figura 145

se presenta el esquema del diseño. Como puede observarse, cada una de las variedades

esta solo una vez en cada columna (columnas latinizadas). A su vez, se han formado

grupos de seis filas cada uno, y cada uno de estos grupos contiene las 30 variedades

(representan una repetición completa). Estas son las dos restricciones a la aleatorización

que se deben considerar en este diseño. A su vez, las filas dentro de cada una de las

repeticiones representan bloques incompletos. Los datos se encuentran en el archivo

Latice fila columna.IBB2.

Para realizar el análisis, en la ventana de selección de variables de Modelos lineales

generales y mixtos seleccionamos Rendimiento como variable, Variedad, Repeticion,

Fila y Columna como criterios de clasificación. Luego, en la solapa Efectos fijos sólo

declaramos Variedad (Figura 146) y en la solapa Efectos aleatorios declaramos el resto

de los efectos como en la Figura 147 .


221

Repetición Fila Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 I

1 21 20 25 14 1 2 10 3 29 28 13 3 11 24 26 5 15 4 16 7 22 19 17 5 30 2 27 9 6 6 4 8 18 23 12

II

7 2 17 14 15 23 8 27 18 24 29 25 9 6 21 10 12 7

10 13 9 20 26 16 11 8 19 3 30 5 12 28 1 11 4 22

III

13 9 29 15 1 8 14 18 14 5 22 10 15 7 27 23 20 11 16 26 25 17 6 3 17 12 30 16 24 28 18 19 4 13 21 2

IV

19 1 26 2 7 18 20 15 16 21 3 27 21 29 12 19 11 14 22 23 5 28 25 9 23 20 10 30 17 4 24 22 13 6 8 24

V

25 5 6 4 16 29 26 24 23 1 10 19 27 25 15 7 13 30 28 17 11 9 18 21 29 14 28 8 27 26 30 3 22 12 2 20

Figura 145: Diagrama del diseño de experimento para el ensayo de 30 variedades de algodón

conducidos como un diseño fila columna latinizado con cinco repeticiones. Todas las variedades están una vez en cada columna y cada repetición, y las filas representan bloques incompletos.


222

Figura 146: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo Látice fila columna.IDB2.


223

Figura 147: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del archivo Látice fila columna.IDB2.

A continuación se presenta la salida correspondiente a estas especificaciones.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.006_Rendimiento_REML<-lme(Rendimiento~1+Variedad ,random=list(.U.=pdBlocked(list(pdIdent(~Repeticion-1) ,pdIdent(~Columna-1))) ,Repeticion=pdIdent(~Fila-1)) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data06 ,keep.data=FALSE) Resultados para el modelo: modelo.006_Rendimiento_REML


224

Variable dependiente: Rendimiento Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 R2_1 R2_2 150 1673.82 1768.59 -802.91 140.59 0.32 0.63 0.70 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 116 1285.12 <0.0001 Variedad 29 116 3.25 <0.0001 Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 116 1285.12 <0.0001 Variedad 29 116 3.25 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdBlocked Formula: ~Repeticion + Columna - 1 Desvíos estándares y correlaciones D.S. Repeticion1 58.01 Repeticion2 58.01 Repeticion3 58.01 Repeticion4 58.01 Repeticion5 58.01 Columna1 111.22 Columna2 111.22 Columna3 111.22 Columna4 111.22 Columna5 111.22 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Fila - 1|Repeticion Desvíos estándares y correlaciones D.S. 1 50.57 10 50.57 11 50.57 12 50.57 13 50.57 14 50.57 15 50.57 16 50.57 17 50.57 18 50.57 19 50.57


225

2 50.57 20 50.57 21 50.57 22 50.57 23 50.57 24 50.57 25 50.57 26 50.57 27 50.57 28 50.57 29 50.57 3 50.57 30 50.57 4 50.57 5 50.57 6 50.57 7 50.57 8 50.57 9 50.57 Medias ajustadas y errores estándares para Variedad LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Variedad Medias E.E. 27 2276.39 86.43 A 13 2268.83 86.43 A B 15 2224.86 86.43 A B C 6 2219.33 86.43 A B C 25 2217.33 86.43 A B C 8 2210.25 86.43 A B C D 10 2200.76 86.43 A B C D E 28 2163.75 86.43 A B C D E F 26 2161.84 86.43 A B C D E F 29 2161.63 86.43 A B C D E F 30 2125.28 86.43 A B C D E F G 20 2114.41 86.43 A B C D E F G 5 2103.10 86.43 A B C D E F G H 18 2094.48 86.43 A B C D E F G H I 19 2090.57 86.43 B C D E F G H I 7 2079.11 86.43 C D E F G H I 23 2071.82 86.43 C D E F G H I 9 2044.57 86.43 C D E F G H I 22 2042.96 86.43 C D E F G H I 11 2029.67 86.43 D E F G H I 14 2026.78 86.43 E F G H I 24 1993.92 86.43 F G H I 4 1992.30 86.43 F G H I 2 1977.78 86.43 G H I J 3 1947.92 86.43 G H I J 16 1944.82 86.43 G H I J 17 1944.00 86.43 G H I J 1 1929.15 86.43 H I J 12 1916.32 86.43 I J 21 1802.28 86.43 J Medias con una letra común no son significativamente diferentes(p<= 0.05)


226

Un análisis de los residuos de este modelo muestra que no hay evidencias que sugieran

violaciones a los supuestos de homoscedasticidad ni de distribución normal (Figura

148), por lo que podemos recomendar variedades en función de su rendimiento de

acuerdo a la prueba LSD de Fisher calculada en el análisis. Las variedades 27, 15, 13, 6,

25, 8, 10, 28, 26, 29, 30, 20, 5 y 18 son las de mayor rendimiento que no difieren

estadísticamente entre sí.

Figura 148: Grafico de dispersión de residuos estandarizados versus predichos y gráfico Q-Q-plot con los residuos del modelo estimado para los datos del archivo Látice fila columna.IDB2.


227

Diseño en látice cuadrado equilibrado

En el ensayo de este ejemplo se probaron 25 variedades de trigo con seis repeticiones.

Dentro de cada cuadrado (repetición) se desea controlar los efectos de fila y de columna

(bloques incompletos en ambos casos). Fue realizado en la Slate Hall Farm,

Cambridgeshire, UK, en 1976 (Gleason, 1997). El esquema del experimento se presenta

a continuación (Figura 149). Los datos se encuentran en el archivo Látice

cuadrado.IDB2. Para analizar estos datos, en el selector de variables de Modelos

lineales generales y mixtos ingresamos Rendimiento con variable, Repeticion, Fila,

Columna y Variedad en criterios de clasificación (Figura 150). Luego de aceptar, en la

solapa Efectos fijos seleccionamos Variedad (Figura 151) y en la solapa de Efectos

aleatorios debemos incluir a la Repetición y luego indicar en el modelo que dentro de

cada repetición tenemos un efecto de filas y de columnas (Figura 152).

1 2 4 3 5 19 23 2 6 15 18 25 9 11 2 6 7 9 8 10 8 12 16 25 4 5 7 16 23 14 21 22 24 23 25 11 20 24 3 7 6 13 22 4 20 11 12 14 13 15 22 1 10 14 18 24 1 15 17 8 16 17 19 18 9 5 9 13 17 21 12 19 3 10 21 3 18 8 13 23 16 24 10 13 2 10 4 17 11 23 1 16 6 11 21 12 20 1 9 23 12 6 24 18 5 5 20 10 15 25 4 7 18 21 15 19 13 1 25 7 2 17 7 12 22 25 2 14 17 6 21 20 8 2 14 4 19 9 14 24 8 11 22 5 19 3 22 15 9 16

Figura 149: Diagrama del diseño de experimento para el ensayo de 25 variedades de trigo conducido como un látice cuadrado equilibrado. Los cuadros en negrilla representan cada una de las seis

repeticiones dentro de las cuales se desea controlar los efectos de fila y de columna.

http://dl.dropbox.com/u/65302225/Datos/Latice%20cuadrado.IDB2�

http://dl.dropbox.com/u/65302225/Datos/Latice%20cuadrado.IDB2�


228

Figura 150: Ventana de selección de variables para Modelos lineales generales y mixtos con los datos del archivo Látice cuadrado.IDB2.


229

Figura 151: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo Látice cuadrado.IDB2.


230

Figura 152: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del archivo Látice cuadrado.IDB2.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.000_Rendimiento_REML<-lme(Rendimiento~1+Variedad ,random=list(Repeticion=pdIdent(~1) ,Repeticion=pdIdent(~Fila-1) ,Repeticion=pdIdent(~Columna-1)) ,method="REML" ,control=lmeControl(msMaxIter=200) ,na.action=na.omit ,data=R.data00 ,keep.data=FALSE) Resultados para el modelo: modelo.000_Rendimiento_REML Variable dependiente: Rendimiento Medidas de ajuste del modelo


231

N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3 150 1703.31 1785.33 -822.65 89.79 0.27 0.38 0.67 0.92 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF denDF F-value p-value (Intercept) 1 120 1216.28 <0.0001 Variedad 24 120 8.84 <0.0001 Pruebas de hipótesis secuenciales numDF denDF F-value p-value (Intercept) 1 120 1216.28 <0.0001 Variedad 24 120 8.84 <0.0001 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Repeticion Desvíos estándares relativos al residual y correlaciones (const) (const) 0.73 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Fila - 1|Repeticion Desvíos estándares relativos al residual y correlaciones D.S. 1 1.39 2 1.39 3 1.39 4 1.39 5 1.39 Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~Columna - 1|Repeticion Desvíos estándares relativos al residual y correlaciones D.S. 1 1.36 2 1.36 3 1.36 4 1.36 5 1.36 Medias ajustadas y errores estándares para Variedad LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No


232

Variedad Medias E.E. Var19 1669.55 60.20 A Var22 1644.38 60.20 A B Var20 1639.95 60.20 A B Var25 1630.63 60.20 A B Var13 1619.04 60.20 A B C Var18 1592.18 60.20 A B C D Var02 1549.01 60.20 A B C D E Var24 1546.47 60.20 B C D E Var05 1533.27 60.20 B C D E F Var06 1527.41 60.20 B C D E F Var17 1498.17 60.20 C D E F G Var15 1498.01 60.20 C D E F G Var21 1493.44 60.20 D E F G Var12 1483.79 60.20 D E F G Var08 1457.37 60.20 E F G H Var04 1451.86 60.20 E F G H I Var03 1420.93 60.20 F G H I J Var07 1400.73 60.20 G H I J K Var16 1346.15 60.20 H I J K Var23 1329.11 60.20 I J K Var11 1327.25 60.20 J K Var14 1326.65 60.20 J K Var09 1298.86 60.20 J K L Var01 1283.59 60.20 K L Var10 1193.22 60.20 L Medias con una letra común no son significativamente diferentes(p<= 0.05)

Como se vio en el ejemplo de Correlación Espacial (pág. 138) una forma alternativa de

modelar este tipo de ensayos es usar la posición en el espacio de las parcelas (de igual

tamaño y en arreglos rectangulares como hemos visto en todo estos diseños en látices)

como covariables para ajustar una función de correlación espacial. El archivo de datos

Látice cuadrado.IDB2 contiene dos variables, Latitud y Longitud, que pueden ser

usadas con este fin. Para evaluara este modelo alternativo, se declaran las variables

como en la Figura 153. Luego, en la solapa Efectos aleatorios no se declara nada, y en

la solapa Correlaciones se ingresan las variables como en la Figura 154.


233

Figura 153: Ventana de selección de variables para Modelos lineales generales y mixtos con la inclusión de covariables de posición Latitud y Longitud para los datos del archivo Látice

cuadrado.IDB2.


234

Figura 154: Ventana de Modelos lineales generales y mixtos con la solapa Correlación desplegada con la inclusión de covariables de posición Latitud y Longitud para los datos del archivo Látice

cuadrado.IDB2.

Modelos lineales generales y mixtos Especificación del modelo en R modelo.002_Rendimiento_REML<-gls(Rendimiento~1+Variedad ,correlation=corExp(form=~as.numeric(as.character(Longitud))+as.numeric(as.character(Latitud)) ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data02) Resultados para el modelo: modelo.002_Rendimiento_REML Variable dependiente: Rendimiento


235

Medidas de ajuste del modelo N AIC BIC logLik Sigma R2_0 150 1692.55 1768.92 -819.28 212.96 0.27 AIC y BIC menores implica mejor Pruebas de hipótesis marginales (SC tipo III) numDF F-value p-value (Intercept) 1 399.80 <0.0001 Variedad 24 7.70 <0.0001 Pruebas de hipótesis secuenciales numDF F-value p-value (Intercept) 1 393.70 <0.0001 Variedad 24 7.70 <0.0001 Estructura de correlación Modelo de correlación: Exponential spatial correlation Formula: ~ as.numeric(as.character(Longitud)) + as.numeric(as.character(Latitud)) Metrica: euclidean Parámetros del modelo Parámetro Estim range 2.45 Medias ajustadas y errores estándares para Variedad LSD Fisher (Alfa=0.05) Procedimiento de corrección de p-valores: No Variedad Medias E.E. Var19 1664.57 86.82 A Var20 1659.01 87.25 A Var13 1626.37 87.32 A B Var22 1589.59 87.21 A B C Var06 1552.97 86.99 A B C D Var24 1550.00 87.19 A B C D Var25 1544.63 87.50 A B C D Var18 1537.52 87.20 A B C D E Var17 1535.60 87.60 A B C D E Var02 1531.18 86.48 A B C D E Var21 1510.73 87.08 B C D E F Var05 1477.87 86.64 C D E F Var08 1473.21 87.17 C D E F Var12 1456.69 87.40 C D E F G Var15 1422.74 87.02 D E F G H Var03 1407.62 86.78 E F G H Var04 1399.11 86.90 E F G H Var07 1389.06 87.46 F G H Var16 1332.43 86.72 G H I Var14 1327.22 87.19 G H I


236

Var11 1326.39 87.04 G H I Var23 1306.36 87.02 H I Var09 1289.71 86.66 H I Var01 1231.80 86.54 I Var10 1201.09 87.28 I Medias con una letra común no son significativamente diferentes(p<= 0.05)

Para comparar esto modelos podemos usar los criterios AIC y BIC (debido a que en este

caso un modelo no es un caso particular del otro no podemos usar el cociente de

verosimilitud).

AIC BIC DBI 1703.31 1785.33 Correlación Espacial 1692.55 1768.92

A partir de estos resultados podemos inferir que el modelo de correlación espacial ajusta

mejor. Sin embargo, si calculamos el promedio de los errores estándar para las

diferencias de medias de ambos modelos podemos ver que el modelo de correlación

espacial da un valor de 69.118 mientras que el modelo que considera la estructura de

diseño da un valor de 62.019. Así, si el objetivo es comparar medias de variedades,

considerar la estructura de diseño es más adecuado.


237

Referencias

Benjamini Y., Hochberg Y.1995. Controlling the false discovery rate: a practical and

powerful approach to multiple testing. J. R. Stat. Soc. Ser. B, 57:289-300.

Benjamini Y., Yekutieli, D. 2001. The control of the false discovery rate in multiple

hypothesis testing under dependency. The Annals of Statistics, 29(4):1165-

1188.

Besag J.E. 1974. Spatial interaction and the statistical analysis of lattice systems. J. R.

Stat. Soc. Ser. B 36: 192-225.

Besag J.E. 1977. Errors-in-variables estimation for Gaussian lattice schemes. J. R. Stat.

Soc. Ser. B 39: 73-78.

Cáceres L., Macchiavelli R, Rojas Y. (2011). A Professional Development Model:

including coaching and problem-based learning. Abstracts, INTED2011

(International Technology, Education and Development Conference),

Valencia, Spain.

Casanoves F., Macchiavelli R., Balzarini, M. 2005. Error variation in multienvironment

peanut trials: Within-trial spatial correlation and between-trial heterogeneity.

Crop Science, 45: 1927-1933.

Casanoves F., Macchiavelli R., Balzarini M. 2007. Models for multi-environment yield

trials with fixed and random block effects and homogeneous and

heterogeneous residual variances. Journal of Agriculture of the University of

Puerto Rico, 91(3-4): 117-131.

Cullis B.R., Gogel B.J., Verbyla A.P., Thompson R. 1998. Spatial analysis of multi-

environment early generation trials. Biometrics 54: 1-18.

Di Rienzo J.A., Guzman A.W., Casanoves F. (2002). A Multiple Comparisons Method

based On the Distribution of the Root Node Distance of a Binary Tree

Obtained by Average Linkage of the Matrix of Euclidean Distances between

Treatment Means. JABES 7(2), 129-142.

Di Rienzo J. 2007.Curso de Diseño de Experimentos 2007. Maestría en Estadística

Aplicada – UNC. http://vaca.agro.uncor.edu/~estad/cursosposgrado.htm


238

Gilmour A.R., Thompson R, Cullis B.R., Verbyla A.P. 1997. Accounting for natural

and extraneous variation in the analysis of field experiments. J. Agric. Biol.

Env. Stat. 2: 269:273.

Gleson A.C. 1997. Spatial Analysis. In R.A. Kempton, P.N. Fox (eds) Statistical

Methods for Plant Variety Evaluation. Chapman & Hall, London.

Hsu J.C. 1996. Multiple Comparisons: Theory and Methods. First edition. Chapman &

Hall, London.

Littell R., Milliken G., Stroup W., Wolfinger R., Schabenberger O. 2006. SAS for

Mixed Models. Second Ed., SAS Institute, Cary, NC.

Littell R., Pendergast J., Natarajan R. 2002. Modelling Covariance Structure in the

Analysis of Repeated Measures Data. Statistics in Medicine 19:1793-1819.

Martínez N. 2006. Determinación de la tasa de degradación de hojarasca de guadua

(Guadua angustifolia) e higuerón (Ficus glabrata) con y sin presencia de

macroinvertebrados acuáticos en una quebrada del Valle del Cauca, Colombia.

Disertación, Departamento de Biología, Universidad del Valle, Colombia.

Mead R. 1971. Models for interplant competition in irregularly spaced population. In:

Statistical Ecology, Patil G.P., Pielou E.C. and Waters W.E. (Eds.).

Pensilvania State University Press, State College, PA, pp: 13-22.

Milliken G.A., Johnson D.E. 1992. Analysis of Messy Data, Vol. 1. Chapman and Hall:

Londres.

Moser E.B., Macchiavelli R. 2002. Model selection techniques for repeated measures

covariance structures. Proceedings of the XIV Conference on Applied

Statistics in Agriculture 14: 17-31.

Navarro C., Cavers S., Pappinen A., Tigerstedt P., Lowe A., Merila J. 2005. Contrasting

quantitative traits and neutral genetic markers for genetic resource assessment

of Mesoamerican Cedrela odorata. Silvae Genetica. 54: 281–292.

Ospina S. 2010. Linking plant strategies and ecosystem function: an assessment of the

contribution of biodiversity to Neotropical grassland productivity. Ph.D. Tesis.

School of the Environment, Natural Resources and Geography, Bangor

University, Gwynedd, United Kingdom, and Program Tropical Agricultural

Research and Higher Education Center (CATIE). Bangor, Reino Unido. 163 p.


239

Ospina S., Rusch G.M., Pezo D., Casanoves F., Sinclair F.L. 2012. More stable

productivity of semi natural grasslands than sown pastures in a seasonally dry

climate. Sent to PLoS ONE.

Papadakis J.S. 1937. Méthode statistique pour des experiences sur champ. Institut

d’Amélioration des Plantes a Thessaloniki.

Patterson H.D.,Thompson R., Hunter E.R., Williams E.R. 1989. Analysis of non-

orthogonal data using REML. Scottish Agricultural Statistical Services

(unpublished notes from an internal course).

Pinheiro J.C., Bates D.M. 2004. Mixed-Effects Models in S and S-PLUS. Springer,

New York.

Pierson R.A., Ginther O.J. 1987. Follicular population dynamics during the estrus cycle

of the mare. Animal Reproduction Science 14: 219–231.

Ripley B.D. 1981. Spatial Statistics. Wiley, New York.

Williams E.R. 1986. Row and column designs with contigous replicates. Australian

Journal of Statistics 28 :149-154.

Zimmerman D.L., Harville D.A. 1991. A random field approach to the analysis of field

plot experiments and other spatial experiments. Biometrics 47: 223-239.

Modelos Mixtos en InfoStat

240

Índice de cuadros

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2 ......................................... 38

Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo

CapacidadRespiratoria.IDB2. ..................................................................................................................................... 115

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo

ECRmani.IDB2 .......................................................................................................................................................... 154

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo

ECRmani.IDB2 .......................................................................................................................................................... 154

Índice de figuras

Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto. .......................................2

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2. ............................3

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.......................6

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2. .........................8

Figura 5: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro

factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se incluyen como efectos

aleatorios anidados. ...................................................................................................................................................... 10


factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se incluyen como efectos

aleatorios anidados (forma explícita). ........................................................................................................................... 10

Figura 7: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de

clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos aleatorios

cruzados. ....................................................................................................................................................................... 11


clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos aleatorios

cruzados con interacción. .............................................................................................................................................. 11


factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos

aleatorios cruzados con interacción y B esta anidado en C. .......................................................................................... 12


factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B y C se incluyen como efectos

aleatorios cruzados, ambos anidados dentro del factor fijo A. ...................................................................................... 12


clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso C y D se incluyen como efectos aleatorios

cruzados, ambos anidados en el efecto aleatorio B. ...................................................................................................... 12


241

Figura 12: Ventana de diálogo para importar datos desde las librerías de R. ............................................................... 14

Figura 13: Encabezamiento de la tabla de datos del archivo Ovary. ............................................................................. 14

Figura 14: Relación entre el número de folículos (follicles) y el tiempo (Time). ......................................................... 15

Figura 15: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary. ..................................... 16

Figura 16: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary. ............................. 17

Figura 17: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary. ...................................... 18

Figura 18: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para cada yegua

originada por el efecto aleatorio sobre la constante (archivo Ovary). ........................................................................... 22

Figura 19: Valores suavizados (polinómico de tercer grado) para el número de folículos (lineas sólidas) para cada

yegua (Archivo Ovary). ................................................................................................................................................ 22

Figura 20: Especificación de la parte fija del modelo (3) ............................................................................................. 23

Figura 21: Especificación de la parte aleatoria del modelo (3). .................................................................................... 23

Figura 22: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos

aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos aleatorios: pdSymm. . 24

Figura 23: Especificación de la parte aleatoria del modelo (3) pero permitiendo que éstos varien en varianza y estén

correlacionados. ............................................................................................................................................................ 24

Figura 24: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos

aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos aleatorios: pdSymm. . 25

Figura 25: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary. ......................... 26

Figura 26: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada (archivo

Atriplex.IDB2). ............................................................................................................................................................. 29

Figura 27: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales desplegada

(archivo Atriplex.IDB2). .............................................................................................................................................. 30

Figura 28: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) excluyendo la

modelación de la autocorrelación serial. ....................................................................................................................... 31

Figura 29: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) incluyendo la

modelación de la autocorrelación serial. ....................................................................................................................... 32

Figura 30: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo

Compvar.IDB2. ............................................................................................................................................................ 35

Figura 31: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la

especificación del Modelo 1. ........................................................................................................................................ 36

Figura 32: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo

1 con los datos del archivo Compvar.IDB2. ................................................................................................................. 39

Figura 33: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del archivo

Compvar.IDB2. ............................................................................................................................................................ 39


242

Figura 34: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la

especificación de varianzas heterogéneas para poblaciones. ........................................................................................ 40

Figura 35: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas residuales

heterogéneas para poblaciones y los datos del archivo Compvar.IDB2. ....................................................................... 45

Figura 36: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la


Figura 37: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la


Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la


Figura 39: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo

2 con los datos del archivo Compvar.IDB2. ................................................................................................................. 51

Figura 40: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo

Compvar.IDB2 ............................................................................................................................................................. 52

Figura 41: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del archivo

Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población. ...................................... 55

Figura 42: Ventana Modelos lineales generales y mixtos con la solapa Efectos aleatorios desplegada para los datos

del archivo Producciones.IDB2 con los efectos aleatorios Linea y Operario cruzados y su interacción. ..................... 57

Figura 43: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2 (gris

oscuro=parcelas bajo riego, gris claro=parcelas en secano).......................................................................................... 62

Figura 44: Encabezamiento de la tabla de datos del archivo Trigo.IDB2. .................................................................... 63


Trigo.IDB2. .................................................................................................................................................................. 63

Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2.............................. 64

Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y

agua como criterios de estratificación. .......................................................................................................................... 65

Figura 48: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada para los datos

del archivo Trigo.IDB2. ................................................................................................................................................ 67

Figura 49: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2. ......................... 68

Figura 50: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con

selección de función varIdent con variedad como criterio de agrupamiento. ............................................................... 69

Figura 51: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y selección de la

subsolapa Medias. ......................................................................................................................................................... 70

Figura 52: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2. ............................................... 72


Cobertura de gotas.IDB2. ............................................................................................................................................. 73

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2......... 73


243

Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2

con Parcela como criterio de estratificación. ................................................................................................................ 74

Figura 56: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara. Archivo

Cobertura de gotas.IDB2. ............................................................................................................................................. 75

Figura 57: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2

con Cara como criterio de agrupamiento. ..................................................................................................................... 76

Figura 58: Diagramas de puntos para estudiar la interacción entre Coad y Altura (a) y entre Cara y Altura (b). ......... 79

Figura 59: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del

almidón.IDB2. .............................................................................................................................................................. 80

Figura 60: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2. ............................................ 81

Figura 61: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Calidad

del Almidón.IDB2. ....................................................................................................................................................... 81

Figura 62: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidón.IDB2. .... 82

Figura 63: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2.

...................................................................................................................................................................................... 83

Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2

que contempla otra forma de especificar la parte aleatoria. .......................................................................................... 85

Figura 65: Relación entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2. ............. 89

Figura 66: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del ejemplo

Cobertura forrajes.IDB2. .............................................................................................................................................. 91

Figura 67: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2. ........ 92

Figura 68: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de efectos aleatorios de Bloque. .................................................................................................................... 93

Figura 69: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de Errores independientes (Modelo 1). ......................................................................................................... 94

Figura 70: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de efectos aleatorios de Bloque y Parcela dentro de bloques. ....................................................................... 95

Figura 71: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2

con selección de función varIdent con tiempo como criterio de agrupamiento. ........................................................... 96


selección de Simetría compuesta para datos agrupados por parcela. ........................................................................... 97


selección de modelo Autorregresivo de orden 1 para datos agrupados por Bloque y Parcela y orden de las

observaciones indicado por la variable Tiempo. ........................................................................................................... 99


selección de modelo Sin estructura para datos agrupados por parcela y orden de las observaciones indicado por la

variable Tiempo (Modelo 11). .................................................................................................................................... 101


244

Figura 75: Ventana del Calculador de probabilidades y cuantiles de InfoStat. ........................................................... 105

Figura 76: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y

selección de la subsolapa Contrastes. ......................................................................................................................... 106

Figura 77: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2. ....................... 109

Figura 78: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2. 110

Figura 79: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos del archivo


Figura 80: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los datos del

archivo CapacidadRespiratoria.IDB2. ........................................................................................................................ 112

Figura 81: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo


Figura 82: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo


Figura 83: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del archivo


Figura 84: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2. ....................................... 119

Figura 85: Ventana de selector de variables con solapa Particiones activada para los datos del archivo

MedCapRes.IDB2....................................................................................................................................................... 120

Figura 86: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del archivo


Figura 87: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo


Figura 88: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro

tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. ................................................................................. 125

Figura 89: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes diferentes para el

logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen

del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. .............................. 126

Figura 90: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro

tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. ................................................................................. 127

Figura 91: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de la materia seca

residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes ordenadas y pendientes.

Archivo Descomposición.IDB2. ................................................................................................................................. 128

Figura 92: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el logaritmo de

la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen del material

vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. .................................................. 128

Figura 93: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el

logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos


245

dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo

Descomposición.IDB2. ............................................................................................................................................... 129

Figura 94: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de orden 2 con

ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2

(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que

lo almacena. Archivo Descomposición.IDB2. ............................................................................................................ 130

Figura 95: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2 con ordenadas

y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2



Figura 96: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas

y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente en función del tiempo y el

tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la

bolsa que lo almacena. Archivo Descomposición.IDB2. ............................................................................................ 131

Figura 97: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de orden 2 con

ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2



Figura 98: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas

y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para

cada combinación de tiempo y tratamiento, para el logaritmo de la materia seca remanente en función del tiempo y el

tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la

bolsa que lo almacena. Archivo Descomposición.IDB2. ............................................................................................ 132

Figura 99: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la

salida de la ejecución de un script o de la visualización de un objeto, Objetos: la lista de los objetos residente en la

memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que envía R a la consola. .... 133

Figura 100: Curvas de tasas de descomposición según especie y tramado de la bolsa de almacenamiento. ............... 137

Figura 101: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo

BF. .............................................................................................................................................................................. 142

Figura 102: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo

BA. ............................................................................................................................................................................. 142

Figura 103: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRmaní.IDB2 y el

Modelo BA. ................................................................................................................................................................ 143

Figura 104: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del

archivo ECRmaní.IDB2 y los Modelos BFH y BAH. ................................................................................................ 144

Figura 105: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e Y

respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y los Modelos Exp

y BFExp. ..................................................................................................................................................................... 145

Figura 106: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la variable

Rendimiento. .............................................................................................................................................................. 159


246

Figura 107: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques completos al azar,

con la aleatorización para un bloque particular de los factores cantidad de nitrógeno y cantidad de riego. Datos del

archivo StripPlot.IDB2. .............................................................................................................................................. 162

Figura 108: Diagramas de puntos de las medias de rendimiento para cada combinación de Riego y Nitrógeno. Datos


Figura 109: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo

StripPlot.IDB2. ........................................................................................................................................................... 164

Figura 110: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del


Figura 111: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los factores

Nitrógeno y Riego cruzados para los datos del archivo StripPlot.IDB2. .................................................................... 166

Figura 112: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo

Lombrices.IDB2. ........................................................................................................................................................ 170

Figura 113: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo

Lombrices.IDB2. ........................................................................................................................................................ 171

Figura 114: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación espacial

exponencial en los datos del archivo Lombrices.IDB2. .............................................................................................. 172

Figura 115: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación

autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2. ......................................................................... 174

Figura 116: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Lombrices.IDB2. ............. 176

Figura 117: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del

archivo Lombrices.IDB2. ........................................................................................................................................... 177

Figura 118: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su efecto sobre la

biomasa. Datos archivo Lombrices.IDB2. .................................................................................................................. 179

Figura 119: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo

mixto con los datos del archivo Lombrices.IDB2. ...................................................................................................... 180

Figura 120: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2. .. 183

Figura 121: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y

selección de Correlación espacial exponencial. .......................................................................................................... 185


selección de Correlación espacial Gaussiana. ............................................................................................................. 186


selección de Correlación espacial lineal. .................................................................................................................... 187


selección de Correlación espacial “rational quadratic”. .............................................................................................. 188


selección de Correlación espacial esférica. ................................................................................................................. 189


247


Testigos_apareados.IDB2. .......................................................................................................................................... 192

Figura 127: Relación entre la Ganancia en aprendizaje y la Calificacion previa al entrenamiento suavizada para cada

uno de los maestros. Archivo Ganancia en aprendizaje.IDB2. ................................................................................... 194

Figura 128: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del

archivo Ganancia en aprendizaje.IDB2. ..................................................................................................................... 196

Figura 129: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos

del archivo Ganancia en aprendizaje.IDB2. ................................................................................................................ 197

Figura 130: Ventana de selección de variables del módulo Modelos lineales generales para los datos del archivo

Productividad primaria.IDB2...................................................................................................................................... 199

Figura 131: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del

archivo Productividad primaria.IDB2. ........................................................................................................................ 200

Figura 132: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los

datos del archivo Productividad primaria.IDB2. ......................................................................................................... 200

Figura 133: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2

con la variable PPacum como regresora y pastura como factor fijo. .......................................................................... 201


con la variable PPacum y POT_PPacum como regresoras y pastura como factor fijo. ............................................... 202

Figura 135: Ventana del módulo Modelos lineales generales con la solapa Heteroscedasticidad desplegada para los

datos del archivo Productividad primaria.IDB2 y la selección de la función VarPower............................................. 203


con la variable PPacum y POT_PPacum como regresoras, pastura como factor fijo y una función VarPower para las

varianzas heterogéneas. .............................................................................................................................................. 204

Figura 137: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del

archivo Productividad primaria.IDB2 y la especificación del modelo con interacción............................................... 205

Figura 138: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los

datos del archivo Productividad primaria.IDB2 y la selección del efecto de potrero como aleatorio. ........................ 206

Figura 139: Diagrama de dispersión mostrando la relación entre productividad primaria y precipitación acumulada

para cada una de las pasturas. Archivo productividad primaria.IDB2. ....................................................................... 210

Figura 140: Ventana Exploración de modelos estimados con la solapa Combinaciones lineales desplegada. Archivo

productividad primaria.IDB2. ..................................................................................................................................... 211

Figura 141: Diagrama del diseño de experimento para el ensayo de 18 variedades de cebada conducido como un alfa

látice. Los número romanos a la derecha indican las repeticiones, los número arabicos en la parte superior de la celda

indican los bloques incompletos (de tamaños 4 y 3) y en la parte inferior las variedades. ......................................... 212

Figura 142: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos identificando a las variedades

para los datos del archivo Alfa látice.IDB2. ............................................................................................................... 213

Figura 143: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando a las

repeticiones para los datos del archivo Alfa látice.IDB2. ........................................................................................... 214


248

Figura 144: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando los efectos

de repetición y bloque incompleto dentro de repetición para los datos del archivo Alfa látice.IDB2. ........................ 216

Figura 145: Diagrama del diseño de experimento para el ensayo de 30 variedades de algodón conducidos como un

diseño fila columna latinizado con cinco repeticiones. Todas las variedades están una vez en cada columna y cada

repetición, y las filas representan bloques incompletos. ............................................................................................. 221

Figura 146: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo

Látice fila columna.IDB2. .......................................................................................................................................... 222

Figura 147: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del

archivo Látice fila columna.IDB2............................................................................................................................... 223

Figura 148: Grafico de dispersión de residuos estandarizados versus predichos y gráfico Q-Q-plot con los residuos

del modelo estimado para los datos del archivo Látice fila columna.IDB2. ............................................................... 226

Figura 149: Diagrama del diseño de experimento para el ensayo de 25 variedades de trigo conducido como un látice

cuadrado equilibrado. Los cuadros en negrilla representan cada una de las seis repeticiones dentro de las cuales se

desea controlar los efectos de fila y de columna. ........................................................................................................ 227

Figura 150: Ventana de selección de variables para Modelos lineales generales y mixtos con los datos del archivo

Látice cuadrado.IDB2. ................................................................................................................................................ 228

Figura 151: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo

Látice cuadrado.IDB2. ................................................................................................................................................ 229

Figura 152: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del

archivo Látice cuadrado.IDB2. ................................................................................................................................... 230

Figura 153: Ventana de selección de variables para Modelos lineales generales y mixtos con la inclusión de

covariables de posición Latitud y Longitud para los datos del archivo Látice cuadrado.IDB2. .................................. 233

Figura 154: Ventana de Modelos lineales generales y mixtos con la solapa Correlación desplegada con la inclusión de

covariables de posición Latitud y Longitud para los datos del archivo Látice cuadrado.IDB2. .................................. 234

Modelos Lineales Mixtosacademic.uprm.edu/rmacchia/agro6005/TutorialModelosMixtosInfostat.pdf ·...

Documents

Transcript of Modelos Lineales Mixtosacademic.uprm.edu/rmacchia/agro6005/TutorialModelosMixtosInfostat.pdf ·...