REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93...

18
Octubre 2017 REPORTE DE PROYECTO Marcadores moleculares en el mejoramiento genético de caña de azúcar CONADESUCA Comite Nacional para el Desarrollo Sustentable de la Caña de Azúcar

Transcript of REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93...

Page 1: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

Octubre 2017

REPORTE DE PROYECTO

Marcadores moleculares en el mejoramiento genético de caña de azúcar

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 2: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

ContenidoINTRODUCCIÓN

OBJETIVO

PROBLEMÁTICA

JUSTIFICACIÓN

DESCRIPCIÓN

RESULTADOS

CONCLUSIONES

BIBLIOGRAFÍA

3

4

5

6

7

11

16

17

Av. Insurgentes Sur 489 Piso 12, Col. Hipódromo Condesa, Del. Cuauhtémoc, Ciudad de México, C.P. 06170, Tel.: (55) 38 71 83 00 ext. 20031

REPORTE DE PROYECTO

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 3: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

13

La Estación de Hibridación (EH) del Centro de Investigación y Desarrollo de la Caña de Azúcar A. C. (CIDCA), ha realizado esfuerzos para la obtención de nuevos

clones con características prometedoras con resistencia a enfermedades,

INTRODUCCIÓN

La caña de azúcar (Saccharum spp. híbridos), es el cultivo industrial más importante para la producción de azúcar a nivel mundial. En México, uno de los principales problemas que enfrenta el sector cañero es la falta de variedades apropiadas para las siete regiones cañeras del país. En estas regiones, existe un número limitado de variedades que ocupan la mayor parte de la super�cie sembrada, entre estas: CP 72-2086, Mex 69-290 y Mex 79-431, que han sido afectadas por diferentes factores; entre ellos, el cambio climático. Las variaciones en el clima en estas regiones, han afectado la producción de azúcar por: la presencia de nuevas enfermedades o de enfermedades re-emergentes, sequías, inundaciones, etc. Debido a ello, se requiere sustituirlas con nuevas variedades, cuya base genética les permita hacer frente a las actuales condiciones ambientales.

La Estación de Hibridación (EH) del Centro de Investigación y Desarrollo de la Caña de Azúcar A. C. (CIDCA), ha realizado esfuerzos para la obtención de nuevos clones con características prometedoras con resistencia a enfermedades, alto contenido de sacarosa, entre otras particularidades agroindustriales

INTR

ODUC

CIÓN sobresalientes. Actualmente, se desconoce

la base genética de cada una de las accesiones de las que se obtienen nuevos clones por medio de cruzamientos convencionales en la EH situada en Tuxtla Chico, Chiapas. Por esta razón, el proyecto “Mejoramiento genético de la caña de azúcar mediante el uso de marcadores moleculares”, puesto en marcha en coordinación con el Comité Nacional para el Desarrollo Sustentable de la Caña de Azúcar (CONADESUCA) y el CIDCA, considera la utilización de marcadores moleculares especí�camente desarrollados para caña de azúcar, que permitan conocer la estructura genética de 94 clones de este cultivo.

Estos resultados serán de gran utilidad para el Programa Nacional de Mejoramiento Genético, que desarrolla el CIDCA, porque permitirán realizar cruzamientos entre clones con diferencias genéticas, en el que exista mayor probabilidad de que la segregación cuente con las características deseables de los progenitores, y que puedan ser evaluados en los Campos Experimentales Regionales (CER), colaboradores del CIDCA.

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 4: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

4

Describir las características del proyecto de concertación entre el CONADESUCA y el CIDCA, así como los resultados del proceso para establecer las bases moleculares para la genotipi�cación de plantas de caña de azúcar (Saccharum spp. híbridos).

Objetivo

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 5: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

5

Variedades sobresalientes de gran importancia por sus rendimientos tanto en campo como en la industria, han llegado casi a desaparecer

por los aspectos fitosanitarios que las afectan.

Problemática

La caña de azúcar es una planta poliploide, condición que hace complejo su mejoramiento genético por métodos convencionales a comparación por ejemplo con el maíz, que es un diploide. Por otra parte, en nuestro país, la producción de caña de azúcar se basa en pocas variedades comerciales, parte de ellas desarrolladas en México. El hecho de contar con un número limitado de variedades, reduce el aprovechamiento potencial de este cultivo hacia factores de productividad, calidad y resistencia a plagas o enfermedades y plagas pre-emergentes.

Variedades sobresalientes de gran importancia por sus rendimientos tanto en campo como en la industria, han llegado casi a desaparecer por los aspectos �tosanitarios que las afectan.

Estudios recientes en caña de azúcar realizados en países como Australia y Brasil, han permitido identi�car marcadores moleculares asociados con caracteres de importancia agroindustrial, además del desarrollo de mapas genéticos, entre otros avances.

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 6: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

6

Con la técnica de marcadores moleculares desarrollados para especies poliploides como DArT (Diversity Array Technology), se podrá realizar el análisis

genético de los clones existentes en el banco de germoplasma del CIDCA.

Justi�cación

Derivado del desconocimiento de la diversidad genética de la caña en nuestro país, la productividad y calidad que requiere la agroindustria, se ven limitadas; al mismo tiempo, se reduce el aprovechamiento potencial de este cultivo hacia factores de resistencia a plagas y enfermedades entre otros factores bióticos.

Actualmente el CIDCA, realiza su Programa Nacional de Mejoramiento Genético de la Caña de Azúcar, utilizando técnicas convencionales a partir de un banco de germoplasma compuesto por cerca de 3 mil accesiones. Mediante la técnica actual, la probabilidad de obtención de nuevas variedades es muy baja, requiriéndose de un promedio de doce años para conocer si las características deseables son iguales o mejores a las de sus progenitores. Dado lo anterior, con el uso de marcadores moleculares se podrán determinar distancias genéticas entre accesiones, que permitan dirigir los cruzamientos; y con ello, aumentar la probabilidad de obtener nuevas variedades con características agroindustriales sobresalientes en un tiempo menor al del método tradicional.

El desarrollo de nuevas variedades de caña de azúcar con características agroindustriales sobresalientes, permitirá aumentar la productividad y enfrentar grandes desafíos originados por el cambio climático, como la presencia de nuevas plagas y la pérdida de fertilidad de los suelos. Con la técnica de marcadores moleculares desarrollados para especies poliploides como DArT (Diversity Array Technology), se podrá realizar el análisis genético de los clones existentes en el banco de germoplasma del CIDCA.

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 7: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

7

Las plantas pertenecientes a los clones candidatos a genotipificación se marcaron para determinar su ciclo vegetativo, características morfológicas y

calidad agroindustrial para correlacionar con los datos genotípicos.

Descripción

genómicas se precipitaron con isopropanol y se disolvieron en agua de grado molecular (Sigma, USA) antes del etiquetado. Los objetivos desnaturalizados se etiquetaron con 2.5 U de fragmentos “exo-Klenow” de Polimerasa I E. coli (NEB), 25 µL de los decámeros aleatorios y 2.5 nM de Cy3-dUTP o Cy5-dUTP (Amersham Bioscience).

Para el etiquetado, los portaobjetos se colocaron al menos 3 h a 37 °C. Los objetivos marcados se desnaturalizaron por 2 min a 95 °C, se mezclaron con 60 µL de la solución de hibridación y se depositaron en el microarreglo.

La solución de hibridación se compuso de una mezcla de 50:5:1 ExpressHyb (Clonetech), ADN de esperma de arenque (Promega, USA), un vector polienlazador-FAM marcado de PCR 2.1 para la clonación (Invitrogen, USA) y 2 µL de EDTA (pH 8.0). La hibridación se realizó durante 18 h a 60 °C; posteriormente, los portaobjetos fueron lavados a temperatura ambiente con cuatro soluciones con un incremento en la astringencia salina (solución 1-1 x SSC, 0.1 % SDS; solución 2-1 x SSC; solución 3-0.2 x SSC; solución 4-0.02 x SSC) y se secaron por centrifugación a 500 x g durante 7 min. Por último, los microarreglos fueron escaneados utilizando un escáner de láser confocal Tecan Ls300 (Grödig, Austria).

La EH del CIDCA, cuenta con más de 2,300 accesiones en el Banco de Germoplasma ubicado en Tuxtla Chico, Chiapas; el cual, está conformado por variedades nacionales e internacionales. Para realizar el proyecto en mención, se requiere de una serie de actividades, mismas que se describen a continuación:

Selección y marcado de plantas en el banco de germoplasma

Las plantas pertenecientes a los clones candidatos a genotipi�cación se marcaron para determinar su ciclo vegetativo, características morfológicas y calidad agroindustrial para correlacionar con los datos genotípicos. Se utilizaron muestras de hojas de 94 clones de caña de azúcar provenientes del Banco de Germoplasma de la EH del CIDCA.

Extracción de ADN de las plantas seleccionadas

Para la extracción de ADN se utilizó el protocolo de Cetyl Trimetil Amonium Bromide (CTAB) propuesto por Doyle and Doyle (1991), con ligeras modi�caciones. Se precalentó el buffer de CTAB al 2 % a 60 °C, después se agregaron 1000 µL de CTAB 2 % en la campana de �ujo laminar en tubos de 2 mL previamente etiquetados. Se pesaron 0.5 g de cada hoja, colocándolos posteriormente en un mortero previamente enfriado y se realizó el molido con nitrógeno líquido, una vez pulverizado fue colocado en los tubos conteniendo el CTAB al 2 % precalentado. (µL= Microlitros; mL=Mililitros)

Los tubos se incubaron a 96 °C por 60 min, y se mezclaron en intervalos de 10 min, después se centrifugaron por 5 min a 11,000 x g. En un tubo nuevo de 1.5 mL, previamente etiquetado, se colocó el sobrenadante y se adicionaron 500 µL de cloroformo-isoamílico (24:1), los tubos se mezclaron por inversión a temperatura ambiente durante 10 min. Posteriormente, se centrifugaron a 11,000 x g por 10 min, se procedió a retirar el sobrenadante y se adicionaron 700 µL de cloroformo-alcohol isoamílico (24:1), y se mezclaron los tubos por inversión durante 10 min. Después se centrifugaron a 11,000 x g por 10 min. En un tubo de 1.5 mL nuevo, previamente etiquetado se adicionaron 600 µL de etanol 100 % frío.

El sobrenadante se colocó en el tubo con Etanol 100 % previamente enfriado a -20 °C y se mezcló suavemente por inversión, al menos 7 veces. Los tubos se incubaron por 2 h a -20 °C.

Los tubos se centrifugaron nuevamente a 11,000 x g por 30 min, y se decantó, evitando perder la pastilla. La pastilla se re-suspendió en 400 µL de agua HPLC y se incubó a 55 °C por 15 min, posteriormente se añadieron 34 µL de acetato de sodio (NaOAc) 3M y 1 mL de Etanol a—20 °C al 95 %, se incubaron a -20 °C durante 1 h y se centrifugaron a 11,000 x g por 5 min para descartar el sobrenadante. La pastilla se lavó dos veces con 650 µL de Etanol al 70 % y se centrifugó por 5 min para dejarla secar. Por último, la pastilla se re-suspendió en 40 µL de agua HPLC y se almacenó a -20 °C.

Determinación de la calidad de ADN por espectrofotometría

La calidad de los ADN obtenidos, correspondiente a las 94 muestras, se cuanti�có por espectrofotometría.

Tanto el análisis de la imagen, la identi�cación del polimor�smo y la puntuación, se realizaron con el programa DArTSoft Mol Breeding (2011) 28:37-55 41 123 (versión 7.4.3), especialmente desarrollado para ese propósito por Diversity Arrrays Technology Pty. Ltd. (www.DiversityArrays.com/software.html) y como se describe en Wenzl et al. (2004) y Akbari et al. (2006).

El DArTSoft analizó las imágenes de microarreglos, extrayendo los datos de intensidad de hibridación de las matrices hibridadas, identi�có y anotó los polimor�smos, y calculó una serie de parámetros de calidad para cada marcador. El análisis de los polimor�smos se realizó con la con�guración predeterminada de DArTSoft; la cual, seleccionó los marcadores de alta calidad y reproducibilidad basados en una amplia experiencia con muchos otros genomas (Wenzl et al. 2004; Wittenberg et al. 2005; Xia et al. 2005), incluyendo el trigo poliploide (Akbari et al. 2006).

Genotipi�cación de las accesiones por DArT

La tasa media de asignaciones alélilas exitosas, el valor promedio de la función “P” (que mide el nivel de bimodalidad relativa de la señal objetivo/Polimor�smo de un lugar en particular) y la reproducibilidad de resultados obtenidos a partir de repeticiones independientes, se consideraron como el criterio de selección a utilizar.

Cada marcador se anotó como presente (1) o ausente (0) en los 94 clones, un marcador se consideró con�able al obtener con éxito por lo menos el 75 % de los individuos, un umbral signi�cativamente menor en comparación con los umbrales utilizados para las especies con genomas menos complejos. Los

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Se registraron los valores de las relaciones A260/A280 y A260/A230, para determinar la calidad del ADN, concluyendo que éste es de buena calidad ya que la absorbancia se encontró en un rango entre 1.8 y 2.0.

Veri�cación de la integridad del ADN por electroforesis

Se realizó en una cámara de electroforesis horizontal con gel de agarosa Seakem (Lonza, USA) al

1.5 % teñido con GelRedTM (Biotium, USA) y se corrió a 80 Volts con buffer Tris-Acetato-EDTA (TAE) durante 1:40 h. Las bandas se observaron en un transiluminador con luz UV.

Fragmentación del ADN y preparación de librerías

Se utilizó la biblioteca con que cuenta la empresa DArT (Canberra, Australia); la cual, se construyó con la información de 4,608 clones de caña de azúcar procedente de diferentes partes del mundo. Las representaciones genómicas, se realizaron en el Laboratorio de la Estación de Hibridación del CIDCA, el resultado de la reducción del genoma complejo de los 94 clones, fueron fragmentados y clonados usando el kit de clonación “TOPO TA” (Invitrogen, USA), de acuerdo al procedimiento recomendado por el fabricante. Las colonias individuales recombinantes de Escherichia coli, se cultivaron por triplicado durante la noche, en placas de 96 pozos en un medio de congelación. [Medio

Luria-Bertani (LB) con 100 mg mL-1 de ampicilina y sales para la eliminación de los efectos inhibitorios del LB].Para la PCR se utilizó 0.5 µL de E. coli como molde para la ampli�cación, a la que se le adicionaron 0.2 µL de cada primer M13 forward y M13 reverse (Invitrogen, USA). Las condiciones de ampli�cación fueron: 95 °C durante 4 min, 57 °C por 37 s, 72 °C durante 1 min seguido por 35 ciclos de 94 °C durante 35 s, 52 °C durante 35 s y �nalmente 72 °C por 7 min. (µL= Microlitros; mL=Mililitros).

Los ampliaciones se secaron, lavaron con etanol al 70 % y se disolvieron en un “spotting buffer” desarrollado especialmente para los portaobjetos del microarreglo cubiertas de Poly-L-Lysina.

Los clones ampli�cados suspendidos en el “spotting buffer” fueron impresos por duplicado sobre los portaobjetos del microarreglo cubiertas de Poly-L-Lysina (Erie Scienti�c) usando un “arrayer MicroGridII” (Biorobotics, USA).

Después de la impresión, el ADN depositado sobre el portaobjetos, se desnaturalizó por incubación en agua caliente (95 °C) durante 2 min, seguido por inmersión en agua MiliQuo suplementada con 0.1 mM de DDT y 0.1 mM EDTA y se secó por centrifugación a 500 x g por 7 min.

Genotipi�cación utilizando las matrices DArT

La preparación de las representaciones genómicas individuales de los 94 genotipos de caña de azúcar para la hibridación de las matrices DArT, se realizó en DArT Canberra, Australia; utilizando los mismos métodos usados para la preparación de las muestras indicadas en el procedimiento anterior. Las representaciones

marcadores fueron evaluados para la desviación de las relaciones de segregación esperados para una dosis única (1:1) y los marcadores de una sola dosis biparentales o marcadores de dosis doble presentes en un solo progenitor (3:1) mediante la prueba de Chi cuadrada (v2) y declarada como distorsionado signi�cativamente en PB 0.05.

Los criterios para elegir a los marcadores polimór�cos candidatos, fue como se describe a continuación:

(1) si la muestra dada hibridó en más de un lugar, las puntuaciones del marcador obtenido se compararon, y se eligieron los marcadores con un máximo de un puntaje discordante;

(2) Si la muestra hibridó sólo en un lugar, la comparación de la puntuación del marcador no podrá realizarse; los marcadores con 100 % de reproducibilidad y P >80 son los que se elegirán.

Análisis de datos fenotípicos y genotípicos

Fenotipos

La información fenotípica incluye variables de interés, por ejemplo rendimiento, altura de planta, producción de sacarosa, resistencia a enfermedades medidas en una escala ordinal, etc.

Genotipos

Los individuos fueron genotipi�cados usando DArT (Diversity Array Technology) de la compañía Triticarte Pty. Ltd. (Canberra, Australia; http://www.triticarte.com.au). Los marcadores toman solo 2 valores (0, 1). Los marcadores con frecuencia del alelo menor más pequeños que 0.05 fueron eliminados, y los genotipos faltantes, fueron imputados en base a las frecuencias alélicas de los marcadores observados.

La información genotípica (marcadores) puede ser utilizada para agrupar individuos, clasi�cando individuos en agrupamientos que sean similares entre sí, pero con distancias genéticas máximas respecto a otros grupos. Los agrupamientos se basaron en matrices de distancias, expresada en dendrogramas; por ejemplo: Euclideana, Rogers, binaria, etc. (Franco et al., 2005). La información fenotípica y genotípica se puede utilizar para ajustar varios modelos estadísticos y obtener información de interés, por ejemplo en el caso de variables continuas, se puede ajustar el modelo siguiente:

yi=µ+Σxijßj+eiDonde yi es la variable respuesta para el individuo i, y xiy es el marcador j para el individuo i y ßj es el efecto del marcador j. También es posible realizar un GWAS (Genome Wide Association Study) para tratar de identi�car regiones del genoma asociadas a alguna característica de interés.

En el caso de variables respuesta ordinal, como las usadas comúnmente para describir el grado de avance de enfermedades, se puede utilizar el modelo de umbrales (McCullagh and Nelder, 1989; Montesinos-López et al., 2015).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 8: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

8

genómicas se precipitaron con isopropanol y se disolvieron en agua de grado molecular (Sigma, USA) antes del etiquetado. Los objetivos desnaturalizados se etiquetaron con 2.5 U de fragmentos “exo-Klenow” de Polimerasa I E. coli (NEB), 25 µL de los decámeros aleatorios y 2.5 nM de Cy3-dUTP o Cy5-dUTP (Amersham Bioscience).

Para el etiquetado, los portaobjetos se colocaron al menos 3 h a 37 °C. Los objetivos marcados se desnaturalizaron por 2 min a 95 °C, se mezclaron con 60 µL de la solución de hibridación y se depositaron en el microarreglo.

La solución de hibridación se compuso de una mezcla de 50:5:1 ExpressHyb (Clonetech), ADN de esperma de arenque (Promega, USA), un vector polienlazador-FAM marcado de PCR 2.1 para la clonación (Invitrogen, USA) y 2 µL de EDTA (pH 8.0). La hibridación se realizó durante 18 h a 60 °C; posteriormente, los portaobjetos fueron lavados a temperatura ambiente con cuatro soluciones con un incremento en la astringencia salina (solución 1-1 x SSC, 0.1 % SDS; solución 2-1 x SSC; solución 3-0.2 x SSC; solución 4-0.02 x SSC) y se secaron por centrifugación a 500 x g durante 7 min. Por último, los microarreglos fueron escaneados utilizando un escáner de láser confocal Tecan Ls300 (Grödig, Austria).

Descripción

La EH del CIDCA, cuenta con más de 2,300 accesiones en el Banco de Germoplasma ubicado en Tuxtla Chico, Chiapas; el cual, está conformado por variedades nacionales e internacionales. Para realizar el proyecto en mención, se requiere de una serie de actividades, mismas que se describen a continuación:

Selección y marcado de plantas en el banco de germoplasma

Las plantas pertenecientes a los clones candidatos a genotipi�cación se marcaron para determinar su ciclo vegetativo, características morfológicas y calidad agroindustrial para correlacionar con los datos genotípicos. Se utilizaron muestras de hojas de 94 clones de caña de azúcar provenientes del Banco de Germoplasma de la EH del CIDCA.

Extracción de ADN de las plantas seleccionadas

Para la extracción de ADN se utilizó el protocolo de Cetyl Trimetil Amonium Bromide (CTAB) propuesto por Doyle and Doyle (1991), con ligeras modi�caciones. Se precalentó el buffer de CTAB al 2 % a 60 °C, después se agregaron 1000 µL de CTAB 2 % en la campana de �ujo laminar en tubos de 2 mL previamente etiquetados. Se pesaron 0.5 g de cada hoja, colocándolos posteriormente en un mortero previamente enfriado y se realizó el molido con nitrógeno líquido, una vez pulverizado fue colocado en los tubos conteniendo el CTAB al 2 % precalentado. (µL= Microlitros; mL=Mililitros)

Los tubos se incubaron a 96 °C por 60 min, y se mezclaron en intervalos de 10 min, después se centrifugaron por 5 min a 11,000 x g. En un tubo nuevo de 1.5 mL, previamente etiquetado, se colocó el sobrenadante y se adicionaron 500 µL de cloroformo-isoamílico (24:1), los tubos se mezclaron por inversión a temperatura ambiente durante 10 min. Posteriormente, se centrifugaron a 11,000 x g por 10 min, se procedió a retirar el sobrenadante y se adicionaron 700 µL de cloroformo-alcohol isoamílico (24:1), y se mezclaron los tubos por inversión durante 10 min. Después se centrifugaron a 11,000 x g por 10 min. En un tubo de 1.5 mL nuevo, previamente etiquetado se adicionaron 600 µL de etanol 100 % frío.

El sobrenadante se colocó en el tubo con Etanol 100 % previamente enfriado a -20 °C y se mezcló suavemente por inversión, al menos 7 veces. Los tubos se incubaron por 2 h a -20 °C.

Los tubos se centrifugaron nuevamente a 11,000 x g por 30 min, y se decantó, evitando perder la pastilla. La pastilla se re-suspendió en 400 µL de agua HPLC y se incubó a 55 °C por 15 min, posteriormente se añadieron 34 µL de acetato de sodio (NaOAc) 3M y 1 mL de Etanol a—20 °C al 95 %, se incubaron a -20 °C durante 1 h y se centrifugaron a 11,000 x g por 5 min para descartar el sobrenadante. La pastilla se lavó dos veces con 650 µL de Etanol al 70 % y se centrifugó por 5 min para dejarla secar. Por último, la pastilla se re-suspendió en 40 µL de agua HPLC y se almacenó a -20 °C.

Determinación de la calidad de ADN por espectrofotometría

La calidad de los ADN obtenidos, correspondiente a las 94 muestras, se cuanti�có por espectrofotometría.

Tanto el análisis de la imagen, la identi�cación del polimor�smo y la puntuación, se realizaron con el programa DArTSoft Mol Breeding (2011) 28:37-55 41 123 (versión 7.4.3), especialmente desarrollado para ese propósito por Diversity Arrrays Technology Pty. Ltd. (www.DiversityArrays.com/software.html) y como se describe en Wenzl et al. (2004) y Akbari et al. (2006).

El DArTSoft analizó las imágenes de microarreglos, extrayendo los datos de intensidad de hibridación de las matrices hibridadas, identi�có y anotó los polimor�smos, y calculó una serie de parámetros de calidad para cada marcador. El análisis de los polimor�smos se realizó con la con�guración predeterminada de DArTSoft; la cual, seleccionó los marcadores de alta calidad y reproducibilidad basados en una amplia experiencia con muchos otros genomas (Wenzl et al. 2004; Wittenberg et al. 2005; Xia et al. 2005), incluyendo el trigo poliploide (Akbari et al. 2006).

Genotipi�cación de las accesiones por DArT

La tasa media de asignaciones alélilas exitosas, el valor promedio de la función “P” (que mide el nivel de bimodalidad relativa de la señal objetivo/Polimor�smo de un lugar en particular) y la reproducibilidad de resultados obtenidos a partir de repeticiones independientes, se consideraron como el criterio de selección a utilizar.

Cada marcador se anotó como presente (1) o ausente (0) en los 94 clones, un marcador se consideró con�able al obtener con éxito por lo menos el 75 % de los individuos, un umbral signi�cativamente menor en comparación con los umbrales utilizados para las especies con genomas menos complejos. Los

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Se registraron los valores de las relaciones A260/A280 y A260/A230, para determinar la calidad del ADN, concluyendo que éste es de buena calidad ya que la absorbancia se encontró en un rango entre 1.8 y 2.0.

Veri�cación de la integridad del ADN por electroforesis

Se realizó en una cámara de electroforesis horizontal con gel de agarosa Seakem (Lonza, USA) al

1.5 % teñido con GelRedTM (Biotium, USA) y se corrió a 80 Volts con buffer Tris-Acetato-EDTA (TAE) durante 1:40 h. Las bandas se observaron en un transiluminador con luz UV.

Fragmentación del ADN y preparación de librerías

Se utilizó la biblioteca con que cuenta la empresa DArT (Canberra, Australia); la cual, se construyó con la información de 4,608 clones de caña de azúcar procedente de diferentes partes del mundo. Las representaciones genómicas, se realizaron en el Laboratorio de la Estación de Hibridación del CIDCA, el resultado de la reducción del genoma complejo de los 94 clones, fueron fragmentados y clonados usando el kit de clonación “TOPO TA” (Invitrogen, USA), de acuerdo al procedimiento recomendado por el fabricante. Las colonias individuales recombinantes de Escherichia coli, se cultivaron por triplicado durante la noche, en placas de 96 pozos en un medio de congelación. [Medio

Luria-Bertani (LB) con 100 mg mL-1 de ampicilina y sales para la eliminación de los efectos inhibitorios del LB].Para la PCR se utilizó 0.5 µL de E. coli como molde para la ampli�cación, a la que se le adicionaron 0.2 µL de cada primer M13 forward y M13 reverse (Invitrogen, USA). Las condiciones de ampli�cación fueron: 95 °C durante 4 min, 57 °C por 37 s, 72 °C durante 1 min seguido por 35 ciclos de 94 °C durante 35 s, 52 °C durante 35 s y �nalmente 72 °C por 7 min. (µL= Microlitros; mL=Mililitros).

Los ampliaciones se secaron, lavaron con etanol al 70 % y se disolvieron en un “spotting buffer” desarrollado especialmente para los portaobjetos del microarreglo cubiertas de Poly-L-Lysina.

Los clones ampli�cados suspendidos en el “spotting buffer” fueron impresos por duplicado sobre los portaobjetos del microarreglo cubiertas de Poly-L-Lysina (Erie Scienti�c) usando un “arrayer MicroGridII” (Biorobotics, USA).

Después de la impresión, el ADN depositado sobre el portaobjetos, se desnaturalizó por incubación en agua caliente (95 °C) durante 2 min, seguido por inmersión en agua MiliQuo suplementada con 0.1 mM de DDT y 0.1 mM EDTA y se secó por centrifugación a 500 x g por 7 min.

Genotipi�cación utilizando las matrices DArT

La preparación de las representaciones genómicas individuales de los 94 genotipos de caña de azúcar para la hibridación de las matrices DArT, se realizó en DArT Canberra, Australia; utilizando los mismos métodos usados para la preparación de las muestras indicadas en el procedimiento anterior. Las representaciones

marcadores fueron evaluados para la desviación de las relaciones de segregación esperados para una dosis única (1:1) y los marcadores de una sola dosis biparentales o marcadores de dosis doble presentes en un solo progenitor (3:1) mediante la prueba de Chi cuadrada (v2) y declarada como distorsionado signi�cativamente en PB 0.05.

Los criterios para elegir a los marcadores polimór�cos candidatos, fue como se describe a continuación:

(1) si la muestra dada hibridó en más de un lugar, las puntuaciones del marcador obtenido se compararon, y se eligieron los marcadores con un máximo de un puntaje discordante;

(2) Si la muestra hibridó sólo en un lugar, la comparación de la puntuación del marcador no podrá realizarse; los marcadores con 100 % de reproducibilidad y P >80 son los que se elegirán.

Análisis de datos fenotípicos y genotípicos

Fenotipos

La información fenotípica incluye variables de interés, por ejemplo rendimiento, altura de planta, producción de sacarosa, resistencia a enfermedades medidas en una escala ordinal, etc.

Genotipos

Los individuos fueron genotipi�cados usando DArT (Diversity Array Technology) de la compañía Triticarte Pty. Ltd. (Canberra, Australia; http://www.triticarte.com.au). Los marcadores toman solo 2 valores (0, 1). Los marcadores con frecuencia del alelo menor más pequeños que 0.05 fueron eliminados, y los genotipos faltantes, fueron imputados en base a las frecuencias alélicas de los marcadores observados.

La información genotípica (marcadores) puede ser utilizada para agrupar individuos, clasi�cando individuos en agrupamientos que sean similares entre sí, pero con distancias genéticas máximas respecto a otros grupos. Los agrupamientos se basaron en matrices de distancias, expresada en dendrogramas; por ejemplo: Euclideana, Rogers, binaria, etc. (Franco et al., 2005). La información fenotípica y genotípica se puede utilizar para ajustar varios modelos estadísticos y obtener información de interés, por ejemplo en el caso de variables continuas, se puede ajustar el modelo siguiente:

yi=µ+Σxijßj+eiDonde yi es la variable respuesta para el individuo i, y xiy es el marcador j para el individuo i y ßj es el efecto del marcador j. También es posible realizar un GWAS (Genome Wide Association Study) para tratar de identi�car regiones del genoma asociadas a alguna característica de interés.

En el caso de variables respuesta ordinal, como las usadas comúnmente para describir el grado de avance de enfermedades, se puede utilizar el modelo de umbrales (McCullagh and Nelder, 1989; Montesinos-López et al., 2015).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

La biblioteca con que cuenta la empresa DArT (Canberra, Australia); se construyó con la información de 4,608 clones de

caña de azúcar procedente de diferentes partes del mundo.

Page 9: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

9

Descripción

genómicas se precipitaron con isopropanol y se disolvieron en agua de grado molecular (Sigma, USA) antes del etiquetado. Los objetivos desnaturalizados se etiquetaron con 2.5 U de fragmentos “exo-Klenow” de Polimerasa I E. coli (NEB), 25 µL de los decámeros aleatorios y 2.5 nM de Cy3-dUTP o Cy5-dUTP (Amersham Bioscience).

Para el etiquetado, los portaobjetos se colocaron al menos 3 h a 37 °C. Los objetivos marcados se desnaturalizaron por 2 min a 95 °C, se mezclaron con 60 µL de la solución de hibridación y se depositaron en el microarreglo.

La solución de hibridación se compuso de una mezcla de 50:5:1 ExpressHyb (Clonetech), ADN de esperma de arenque (Promega, USA), un vector polienlazador-FAM marcado de PCR 2.1 para la clonación (Invitrogen, USA) y 2 µL de EDTA (pH 8.0). La hibridación se realizó durante 18 h a 60 °C; posteriormente, los portaobjetos fueron lavados a temperatura ambiente con cuatro soluciones con un incremento en la astringencia salina (solución 1-1 x SSC, 0.1 % SDS; solución 2-1 x SSC; solución 3-0.2 x SSC; solución 4-0.02 x SSC) y se secaron por centrifugación a 500 x g durante 7 min. Por último, los microarreglos fueron escaneados utilizando un escáner de láser confocal Tecan Ls300 (Grödig, Austria).

La EH del CIDCA, cuenta con más de 2,300 accesiones en el Banco de Germoplasma ubicado en Tuxtla Chico, Chiapas; el cual, está conformado por variedades nacionales e internacionales. Para realizar el proyecto en mención, se requiere de una serie de actividades, mismas que se describen a continuación:

Selección y marcado de plantas en el banco de germoplasma

Las plantas pertenecientes a los clones candidatos a genotipi�cación se marcaron para determinar su ciclo vegetativo, características morfológicas y calidad agroindustrial para correlacionar con los datos genotípicos. Se utilizaron muestras de hojas de 94 clones de caña de azúcar provenientes del Banco de Germoplasma de la EH del CIDCA.

Extracción de ADN de las plantas seleccionadas

Para la extracción de ADN se utilizó el protocolo de Cetyl Trimetil Amonium Bromide (CTAB) propuesto por Doyle and Doyle (1991), con ligeras modi�caciones. Se precalentó el buffer de CTAB al 2 % a 60 °C, después se agregaron 1000 µL de CTAB 2 % en la campana de �ujo laminar en tubos de 2 mL previamente etiquetados. Se pesaron 0.5 g de cada hoja, colocándolos posteriormente en un mortero previamente enfriado y se realizó el molido con nitrógeno líquido, una vez pulverizado fue colocado en los tubos conteniendo el CTAB al 2 % precalentado. (µL= Microlitros; mL=Mililitros)

Los tubos se incubaron a 96 °C por 60 min, y se mezclaron en intervalos de 10 min, después se centrifugaron por 5 min a 11,000 x g. En un tubo nuevo de 1.5 mL, previamente etiquetado, se colocó el sobrenadante y se adicionaron 500 µL de cloroformo-isoamílico (24:1), los tubos se mezclaron por inversión a temperatura ambiente durante 10 min. Posteriormente, se centrifugaron a 11,000 x g por 10 min, se procedió a retirar el sobrenadante y se adicionaron 700 µL de cloroformo-alcohol isoamílico (24:1), y se mezclaron los tubos por inversión durante 10 min. Después se centrifugaron a 11,000 x g por 10 min. En un tubo de 1.5 mL nuevo, previamente etiquetado se adicionaron 600 µL de etanol 100 % frío.

El sobrenadante se colocó en el tubo con Etanol 100 % previamente enfriado a -20 °C y se mezcló suavemente por inversión, al menos 7 veces. Los tubos se incubaron por 2 h a -20 °C.

Los tubos se centrifugaron nuevamente a 11,000 x g por 30 min, y se decantó, evitando perder la pastilla. La pastilla se re-suspendió en 400 µL de agua HPLC y se incubó a 55 °C por 15 min, posteriormente se añadieron 34 µL de acetato de sodio (NaOAc) 3M y 1 mL de Etanol a—20 °C al 95 %, se incubaron a -20 °C durante 1 h y se centrifugaron a 11,000 x g por 5 min para descartar el sobrenadante. La pastilla se lavó dos veces con 650 µL de Etanol al 70 % y se centrifugó por 5 min para dejarla secar. Por último, la pastilla se re-suspendió en 40 µL de agua HPLC y se almacenó a -20 °C.

Determinación de la calidad de ADN por espectrofotometría

La calidad de los ADN obtenidos, correspondiente a las 94 muestras, se cuanti�có por espectrofotometría.

Tanto el análisis de la imagen, la identi�cación del polimor�smo y la puntuación, se realizaron con el programa DArTSoft Mol Breeding (2011) 28:37-55 41 123 (versión 7.4.3), especialmente desarrollado para ese propósito por Diversity Arrrays Technology Pty. Ltd. (www.DiversityArrays.com/software.html) y como se describe en Wenzl et al. (2004) y Akbari et al. (2006).

El DArTSoft analizó las imágenes de microarreglos, extrayendo los datos de intensidad de hibridación de las matrices hibridadas, identi�có y anotó los polimor�smos, y calculó una serie de parámetros de calidad para cada marcador. El análisis de los polimor�smos se realizó con la con�guración predeterminada de DArTSoft; la cual, seleccionó los marcadores de alta calidad y reproducibilidad basados en una amplia experiencia con muchos otros genomas (Wenzl et al. 2004; Wittenberg et al. 2005; Xia et al. 2005), incluyendo el trigo poliploide (Akbari et al. 2006).

Genotipi�cación de las accesiones por DArT

La tasa media de asignaciones alélilas exitosas, el valor promedio de la función “P” (que mide el nivel de bimodalidad relativa de la señal objetivo/Polimor�smo de un lugar en particular) y la reproducibilidad de resultados obtenidos a partir de repeticiones independientes, se consideraron como el criterio de selección a utilizar.

Cada marcador se anotó como presente (1) o ausente (0) en los 94 clones, un marcador se consideró con�able al obtener con éxito por lo menos el 75 % de los individuos, un umbral signi�cativamente menor en comparación con los umbrales utilizados para las especies con genomas menos complejos. Los

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Para el etiquetado, los portaobjetos se colocaron al menos 3 h a 37 °C. Los objetivos marcados se desnaturalizaron por 2 min a 95 °C, se mezclaron con

60 μL de la solución de hibridación y se depositaron en el microarreglo.

Se registraron los valores de las relaciones A260/A280 y A260/A230, para determinar la calidad del ADN, concluyendo que éste es de buena calidad ya que la absorbancia se encontró en un rango entre 1.8 y 2.0.

Veri�cación de la integridad del ADN por electroforesis

Se realizó en una cámara de electroforesis horizontal con gel de agarosa Seakem (Lonza, USA) al

1.5 % teñido con GelRedTM (Biotium, USA) y se corrió a 80 Volts con buffer Tris-Acetato-EDTA (TAE) durante 1:40 h. Las bandas se observaron en un transiluminador con luz UV.

Fragmentación del ADN y preparación de librerías

Se utilizó la biblioteca con que cuenta la empresa DArT (Canberra, Australia); la cual, se construyó con la información de 4,608 clones de caña de azúcar procedente de diferentes partes del mundo. Las representaciones genómicas, se realizaron en el Laboratorio de la Estación de Hibridación del CIDCA, el resultado de la reducción del genoma complejo de los 94 clones, fueron fragmentados y clonados usando el kit de clonación “TOPO TA” (Invitrogen, USA), de acuerdo al procedimiento recomendado por el fabricante. Las colonias individuales recombinantes de Escherichia coli, se cultivaron por triplicado durante la noche, en placas de 96 pozos en un medio de congelación. [Medio

Luria-Bertani (LB) con 100 mg mL-1 de ampicilina y sales para la eliminación de los efectos inhibitorios del LB].Para la PCR se utilizó 0.5 µL de E. coli como molde para la ampli�cación, a la que se le adicionaron 0.2 µL de cada primer M13 forward y M13 reverse (Invitrogen, USA). Las condiciones de ampli�cación fueron: 95 °C durante 4 min, 57 °C por 37 s, 72 °C durante 1 min seguido por 35 ciclos de 94 °C durante 35 s, 52 °C durante 35 s y �nalmente 72 °C por 7 min. (µL= Microlitros; mL=Mililitros).

Los ampliaciones se secaron, lavaron con etanol al 70 % y se disolvieron en un “spotting buffer” desarrollado especialmente para los portaobjetos del microarreglo cubiertas de Poly-L-Lysina.

Los clones ampli�cados suspendidos en el “spotting buffer” fueron impresos por duplicado sobre los portaobjetos del microarreglo cubiertas de Poly-L-Lysina (Erie Scienti�c) usando un “arrayer MicroGridII” (Biorobotics, USA).

Después de la impresión, el ADN depositado sobre el portaobjetos, se desnaturalizó por incubación en agua caliente (95 °C) durante 2 min, seguido por inmersión en agua MiliQuo suplementada con 0.1 mM de DDT y 0.1 mM EDTA y se secó por centrifugación a 500 x g por 7 min.

Genotipi�cación utilizando las matrices DArT

La preparación de las representaciones genómicas individuales de los 94 genotipos de caña de azúcar para la hibridación de las matrices DArT, se realizó en DArT Canberra, Australia; utilizando los mismos métodos usados para la preparación de las muestras indicadas en el procedimiento anterior. Las representaciones

marcadores fueron evaluados para la desviación de las relaciones de segregación esperados para una dosis única (1:1) y los marcadores de una sola dosis biparentales o marcadores de dosis doble presentes en un solo progenitor (3:1) mediante la prueba de Chi cuadrada (v2) y declarada como distorsionado signi�cativamente en PB 0.05.

Los criterios para elegir a los marcadores polimór�cos candidatos, fue como se describe a continuación:

(1) si la muestra dada hibridó en más de un lugar, las puntuaciones del marcador obtenido se compararon, y se eligieron los marcadores con un máximo de un puntaje discordante;

(2) Si la muestra hibridó sólo en un lugar, la comparación de la puntuación del marcador no podrá realizarse; los marcadores con 100 % de reproducibilidad y P >80 son los que se elegirán.

Análisis de datos fenotípicos y genotípicos

Fenotipos

La información fenotípica incluye variables de interés, por ejemplo rendimiento, altura de planta, producción de sacarosa, resistencia a enfermedades medidas en una escala ordinal, etc.

Genotipos

Los individuos fueron genotipi�cados usando DArT (Diversity Array Technology) de la compañía Triticarte Pty. Ltd. (Canberra, Australia; http://www.triticarte.com.au). Los marcadores toman solo 2 valores (0, 1). Los marcadores con frecuencia del alelo menor más pequeños que 0.05 fueron eliminados, y los genotipos faltantes, fueron imputados en base a las frecuencias alélicas de los marcadores observados.

La información genotípica (marcadores) puede ser utilizada para agrupar individuos, clasi�cando individuos en agrupamientos que sean similares entre sí, pero con distancias genéticas máximas respecto a otros grupos. Los agrupamientos se basaron en matrices de distancias, expresada en dendrogramas; por ejemplo: Euclideana, Rogers, binaria, etc. (Franco et al., 2005). La información fenotípica y genotípica se puede utilizar para ajustar varios modelos estadísticos y obtener información de interés, por ejemplo en el caso de variables continuas, se puede ajustar el modelo siguiente:

yi=µ+Σxijßj+eiDonde yi es la variable respuesta para el individuo i, y xiy es el marcador j para el individuo i y ßj es el efecto del marcador j. También es posible realizar un GWAS (Genome Wide Association Study) para tratar de identi�car regiones del genoma asociadas a alguna característica de interés.

En el caso de variables respuesta ordinal, como las usadas comúnmente para describir el grado de avance de enfermedades, se puede utilizar el modelo de umbrales (McCullagh and Nelder, 1989; Montesinos-López et al., 2015).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 10: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

genómicas se precipitaron con isopropanol y se disolvieron en agua de grado molecular (Sigma, USA) antes del etiquetado. Los objetivos desnaturalizados se etiquetaron con 2.5 U de fragmentos “exo-Klenow” de Polimerasa I E. coli (NEB), 25 µL de los decámeros aleatorios y 2.5 nM de Cy3-dUTP o Cy5-dUTP (Amersham Bioscience).

Para el etiquetado, los portaobjetos se colocaron al menos 3 h a 37 °C. Los objetivos marcados se desnaturalizaron por 2 min a 95 °C, se mezclaron con 60 µL de la solución de hibridación y se depositaron en el microarreglo.

La solución de hibridación se compuso de una mezcla de 50:5:1 ExpressHyb (Clonetech), ADN de esperma de arenque (Promega, USA), un vector polienlazador-FAM marcado de PCR 2.1 para la clonación (Invitrogen, USA) y 2 µL de EDTA (pH 8.0). La hibridación se realizó durante 18 h a 60 °C; posteriormente, los portaobjetos fueron lavados a temperatura ambiente con cuatro soluciones con un incremento en la astringencia salina (solución 1-1 x SSC, 0.1 % SDS; solución 2-1 x SSC; solución 3-0.2 x SSC; solución 4-0.02 x SSC) y se secaron por centrifugación a 500 x g durante 7 min. Por último, los microarreglos fueron escaneados utilizando un escáner de láser confocal Tecan Ls300 (Grödig, Austria).

La EH del CIDCA, cuenta con más de 2,300 accesiones en el Banco de Germoplasma ubicado en Tuxtla Chico, Chiapas; el cual, está conformado por variedades nacionales e internacionales. Para realizar el proyecto en mención, se requiere de una serie de actividades, mismas que se describen a continuación:

Selección y marcado de plantas en el banco de germoplasma

Las plantas pertenecientes a los clones candidatos a genotipi�cación se marcaron para determinar su ciclo vegetativo, características morfológicas y calidad agroindustrial para correlacionar con los datos genotípicos. Se utilizaron muestras de hojas de 94 clones de caña de azúcar provenientes del Banco de Germoplasma de la EH del CIDCA.

Extracción de ADN de las plantas seleccionadas

Para la extracción de ADN se utilizó el protocolo de Cetyl Trimetil Amonium Bromide (CTAB) propuesto por Doyle and Doyle (1991), con ligeras modi�caciones. Se precalentó el buffer de CTAB al 2 % a 60 °C, después se agregaron 1000 µL de CTAB 2 % en la campana de �ujo laminar en tubos de 2 mL previamente etiquetados. Se pesaron 0.5 g de cada hoja, colocándolos posteriormente en un mortero previamente enfriado y se realizó el molido con nitrógeno líquido, una vez pulverizado fue colocado en los tubos conteniendo el CTAB al 2 % precalentado. (µL= Microlitros; mL=Mililitros)

Los tubos se incubaron a 96 °C por 60 min, y se mezclaron en intervalos de 10 min, después se centrifugaron por 5 min a 11,000 x g. En un tubo nuevo de 1.5 mL, previamente etiquetado, se colocó el sobrenadante y se adicionaron 500 µL de cloroformo-isoamílico (24:1), los tubos se mezclaron por inversión a temperatura ambiente durante 10 min. Posteriormente, se centrifugaron a 11,000 x g por 10 min, se procedió a retirar el sobrenadante y se adicionaron 700 µL de cloroformo-alcohol isoamílico (24:1), y se mezclaron los tubos por inversión durante 10 min. Después se centrifugaron a 11,000 x g por 10 min. En un tubo de 1.5 mL nuevo, previamente etiquetado se adicionaron 600 µL de etanol 100 % frío.

El sobrenadante se colocó en el tubo con Etanol 100 % previamente enfriado a -20 °C y se mezcló suavemente por inversión, al menos 7 veces. Los tubos se incubaron por 2 h a -20 °C.

Los tubos se centrifugaron nuevamente a 11,000 x g por 30 min, y se decantó, evitando perder la pastilla. La pastilla se re-suspendió en 400 µL de agua HPLC y se incubó a 55 °C por 15 min, posteriormente se añadieron 34 µL de acetato de sodio (NaOAc) 3M y 1 mL de Etanol a—20 °C al 95 %, se incubaron a -20 °C durante 1 h y se centrifugaron a 11,000 x g por 5 min para descartar el sobrenadante. La pastilla se lavó dos veces con 650 µL de Etanol al 70 % y se centrifugó por 5 min para dejarla secar. Por último, la pastilla se re-suspendió en 40 µL de agua HPLC y se almacenó a -20 °C.

Determinación de la calidad de ADN por espectrofotometría

La calidad de los ADN obtenidos, correspondiente a las 94 muestras, se cuanti�có por espectrofotometría.

Tanto el análisis de la imagen, la identi�cación del polimor�smo y la puntuación, se realizaron con el programa DArTSoft Mol Breeding (2011) 28:37-55 41 123 (versión 7.4.3), especialmente desarrollado para ese propósito por Diversity Arrrays Technology Pty. Ltd. (www.DiversityArrays.com/software.html) y como se describe en Wenzl et al. (2004) y Akbari et al. (2006).

El DArTSoft analizó las imágenes de microarreglos, extrayendo los datos de intensidad de hibridación de las matrices hibridadas, identi�có y anotó los polimor�smos, y calculó una serie de parámetros de calidad para cada marcador. El análisis de los polimor�smos se realizó con la con�guración predeterminada de DArTSoft; la cual, seleccionó los marcadores de alta calidad y reproducibilidad basados en una amplia experiencia con muchos otros genomas (Wenzl et al. 2004; Wittenberg et al. 2005; Xia et al. 2005), incluyendo el trigo poliploide (Akbari et al. 2006).

Genotipi�cación de las accesiones por DArT

La tasa media de asignaciones alélilas exitosas, el valor promedio de la función “P” (que mide el nivel de bimodalidad relativa de la señal objetivo/Polimor�smo de un lugar en particular) y la reproducibilidad de resultados obtenidos a partir de repeticiones independientes, se consideraron como el criterio de selección a utilizar.

Cada marcador se anotó como presente (1) o ausente (0) en los 94 clones, un marcador se consideró con�able al obtener con éxito por lo menos el 75 % de los individuos, un umbral signi�cativamente menor en comparación con los umbrales utilizados para las especies con genomas menos complejos. Los

10

Descripción

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

La información genotípica (marcadores) puede ser utilizada para agrupar individuos, clasificando individuos en agrupamientos que sean similares entre sí, pero con distancias genéticas máximas respecto a otros grupos.

Se registraron los valores de las relaciones A260/A280 y A260/A230, para determinar la calidad del ADN, concluyendo que éste es de buena calidad ya que la absorbancia se encontró en un rango entre 1.8 y 2.0.

Veri�cación de la integridad del ADN por electroforesis

Se realizó en una cámara de electroforesis horizontal con gel de agarosa Seakem (Lonza, USA) al

1.5 % teñido con GelRedTM (Biotium, USA) y se corrió a 80 Volts con buffer Tris-Acetato-EDTA (TAE) durante 1:40 h. Las bandas se observaron en un transiluminador con luz UV.

Fragmentación del ADN y preparación de librerías

Se utilizó la biblioteca con que cuenta la empresa DArT (Canberra, Australia); la cual, se construyó con la información de 4,608 clones de caña de azúcar procedente de diferentes partes del mundo. Las representaciones genómicas, se realizaron en el Laboratorio de la Estación de Hibridación del CIDCA, el resultado de la reducción del genoma complejo de los 94 clones, fueron fragmentados y clonados usando el kit de clonación “TOPO TA” (Invitrogen, USA), de acuerdo al procedimiento recomendado por el fabricante. Las colonias individuales recombinantes de Escherichia coli, se cultivaron por triplicado durante la noche, en placas de 96 pozos en un medio de congelación. [Medio

Luria-Bertani (LB) con 100 mg mL-1 de ampicilina y sales para la eliminación de los efectos inhibitorios del LB].Para la PCR se utilizó 0.5 µL de E. coli como molde para la ampli�cación, a la que se le adicionaron 0.2 µL de cada primer M13 forward y M13 reverse (Invitrogen, USA). Las condiciones de ampli�cación fueron: 95 °C durante 4 min, 57 °C por 37 s, 72 °C durante 1 min seguido por 35 ciclos de 94 °C durante 35 s, 52 °C durante 35 s y �nalmente 72 °C por 7 min. (µL= Microlitros; mL=Mililitros).

Los ampliaciones se secaron, lavaron con etanol al 70 % y se disolvieron en un “spotting buffer” desarrollado especialmente para los portaobjetos del microarreglo cubiertas de Poly-L-Lysina.

Los clones ampli�cados suspendidos en el “spotting buffer” fueron impresos por duplicado sobre los portaobjetos del microarreglo cubiertas de Poly-L-Lysina (Erie Scienti�c) usando un “arrayer MicroGridII” (Biorobotics, USA).

Después de la impresión, el ADN depositado sobre el portaobjetos, se desnaturalizó por incubación en agua caliente (95 °C) durante 2 min, seguido por inmersión en agua MiliQuo suplementada con 0.1 mM de DDT y 0.1 mM EDTA y se secó por centrifugación a 500 x g por 7 min.

Genotipi�cación utilizando las matrices DArT

La preparación de las representaciones genómicas individuales de los 94 genotipos de caña de azúcar para la hibridación de las matrices DArT, se realizó en DArT Canberra, Australia; utilizando los mismos métodos usados para la preparación de las muestras indicadas en el procedimiento anterior. Las representaciones

marcadores fueron evaluados para la desviación de las relaciones de segregación esperados para una dosis única (1:1) y los marcadores de una sola dosis biparentales o marcadores de dosis doble presentes en un solo progenitor (3:1) mediante la prueba de Chi cuadrada (v2) y declarada como distorsionado signi�cativamente en PB 0.05.

Los criterios para elegir a los marcadores polimór�cos candidatos, fue como se describe a continuación:

(1) si la muestra dada hibridó en más de un lugar, las puntuaciones del marcador obtenido se compararon, y se eligieron los marcadores con un máximo de un puntaje discordante;

(2) Si la muestra hibridó sólo en un lugar, la comparación de la puntuación del marcador no podrá realizarse; los marcadores con 100 % de reproducibilidad y P >80 son los que se elegirán.

Análisis de datos fenotípicos y genotípicos

Fenotipos

La información fenotípica incluye variables de interés, por ejemplo rendimiento, altura de planta, producción de sacarosa, resistencia a enfermedades medidas en una escala ordinal, etc.

Genotipos

Los individuos fueron genotipi�cados usando DArT (Diversity Array Technology) de la compañía Triticarte Pty. Ltd. (Canberra, Australia; http://www.triticarte.com.au). Los marcadores toman solo 2 valores (0, 1). Los marcadores con frecuencia del alelo menor más pequeños que 0.05 fueron eliminados, y los genotipos faltantes, fueron imputados en base a las frecuencias alélicas de los marcadores observados.

La información genotípica (marcadores) puede ser utilizada para agrupar individuos, clasi�cando individuos en agrupamientos que sean similares entre sí, pero con distancias genéticas máximas respecto a otros grupos. Los agrupamientos se basaron en matrices de distancias, expresada en dendrogramas; por ejemplo: Euclideana, Rogers, binaria, etc. (Franco et al., 2005). La información fenotípica y genotípica se puede utilizar para ajustar varios modelos estadísticos y obtener información de interés, por ejemplo en el caso de variables continuas, se puede ajustar el modelo siguiente:

yi=µ+Σxijßj+eiDonde yi es la variable respuesta para el individuo i, y xiy es el marcador j para el individuo i y ßj es el efecto del marcador j. También es posible realizar un GWAS (Genome Wide Association Study) para tratar de identi�car regiones del genoma asociadas a alguna característica de interés.

En el caso de variables respuesta ordinal, como las usadas comúnmente para describir el grado de avance de enfermedades, se puede utilizar el modelo de umbrales (McCullagh and Nelder, 1989; Montesinos-López et al., 2015).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 11: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

11

Resultados

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

El conocimiento de la información genética más distante, permitirá en algunos casos, obtener híbridos con las mejores características genéticas de sus progenitores,

reduciendo al menos en un 10 % el tiempo en la obtención de nuevas variedades.

A partir de los datos generados por el HiSeq 2500 v 4.0 para la genotipi�cación y enviados por la compañía Diversity Array Technology (DArT), con sede en la Universidad de Canberra en Australia, se procedió al análisis, para obtener información sobre la matriz de datos genéticos y el dendrograma de distancias genéticas entre las 94 accesiones.

Se procedió al envío del ADN para la obtención de información de todo el genoma de los clones de caña de azúcar mediante la tecnología DArT-Seq (Fig. 1).

Una vez que arribaron las muestras a las instalaciones de DArT, el ADN fue evaluado con base a sus controles de calidad (Fig. 2).

Figura 1. A) Muestra el procedimiento de colocación de la placa para genotipificación mediante DArT-Seq. B) El paquete conteniendo la placa para secuenciación en DArT, Canberra.

Figura 2: La compañía DArT recibe las muestras y envía comunicado informando que las mismas han pasado en control de calidad.

A

B

Una vez que pasó el control de calidad, las muestras continuaron el procedimiento de genotipi�cación y el envío de resultados (Fig. 3).

Los resultados se analizaron de acuerdo a los protocolos para análisis de un alto número de datos, los marcadores generados son de tipo “presencia” (1) y “ausencia” (0) de un fragmento de restricción que contiene el marcador de interés. En total se obtuvieron 52, 828 marcadores para cada variedad con un porcentaje bajo de marcadores que tuvieron valores faltantes por celda (Fig. 4).

Debido a que no se puede trabajar tasas de valores faltantes por marcador bastante bajas, se realizó una imputación basada en las frecuencias de los marcadores observados. Los marcadores con frecuencia del alelo menor inferiores a 0.05 se eliminaron (Fig. 5).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 12: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

12

Resultados

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

El uso de marcadores moleculares DArT desarrollado para especies poliploides como caña de azúcar, permite realizar el análisis genético de los clones seleccionados.

A partir de los datos generados por el HiSeq 2500 v 4.0 para la genotipi�cación y enviados por la compañía Diversity Array Technology (DArT), con sede en la Universidad de Canberra en Australia, se procedió al análisis, para obtener información sobre la matriz de datos genéticos y el dendrograma de distancias genéticas entre las 94 accesiones.

Se procedió al envío del ADN para la obtención de información de todo el genoma de los clones de caña de azúcar mediante la tecnología DArT-Seq (Fig. 1).

Una vez que arribaron las muestras a las instalaciones de DArT, el ADN fue evaluado con base a sus controles de calidad (Fig. 2).

Figura 3: La compañía DArT completo el análisis de las muestras enviadas de caña de azúcar para genotipificación con una alta densidad de marcadores.

Figura 4. Distribución de valores faltantes

Una vez que pasó el control de calidad, las muestras continuaron el procedimiento de genotipi�cación y el envío de resultados (Fig. 3).

Los resultados se analizaron de acuerdo a los protocolos para análisis de un alto número de datos, los marcadores generados son de tipo “presencia” (1) y “ausencia” (0) de un fragmento de restricción que contiene el marcador de interés. En total se obtuvieron 52, 828 marcadores para cada variedad con un porcentaje bajo de marcadores que tuvieron valores faltantes por celda (Fig. 4).

Debido a que no se puede trabajar tasas de valores faltantes por marcador bastante bajas, se realizó una imputación basada en las frecuencias de los marcadores observados. Los marcadores con frecuencia del alelo menor inferiores a 0.05 se eliminaron (Fig. 5).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 13: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

13

Resultados

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Figura 5. Distribución de frecuencias del alelo menor (MAF).

Figura 6. Mapa de calor para las variedades de caña de azúcar analizadas mediante la técnica de Diversity Array Technology (DArT).

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 14: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

14

Resultados

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Figura 7. Dendrograma para las variedades de caña de azúcar construida con base en la información molecular, se observa las distancias genéticas entre los clones estudiados.

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 15: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

15

Resultados

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Figura 8. Matriz de distancias Euclidianas entre cada uno de los clones de caña de azúcar genotipificados con la metodología de DArT-Seq.

Figura 9. A). Presentación de resultados al personal de la Estación de Hibridación del CIDCA coordinados por el Dr. Carlos Flores Revilla. B) Exposición de los heatmap obtenidos de las muestras analizadas de caña de azúcar por parte del Dr. Paulino Pérez Rodríguez.

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Page 16: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

16

Conclusiones

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

En México, hasta 1990, el Instituto para el Mejoramiento de la Producción de Azúcar (IMPA) coordinaba los trabajos de mejoramiento genético de la caña de azúcar. En la actualidad, el CIDCA continúa con los trabajos relacionados con este tema.

A �n de encausar y dar seguimiento a estos trabajos de investigación en caña de azúcar, es necesario fortalecer un Programa Nacional de Mejoramiento Genético en caña de azúcar mediante el uso de marcadores moleculares. Continuar solamente con la siembra de las variedades que se han empleado para este cultivo, limita la productividad y calidad agroindustrial, debido al cambio climático que se está presentando en las diferentes regiones agroecológicas que cuentan con diferentes microclimas especí�cos para la producción de este cultivo.

Se concluyó que el uso de marcadores moleculares DArT desarrollado para especies poliploides como caña de azúcar, permitió realizar el análisis genético de los clones analizados. Con estas herramientas, se podrán determinar las distancias genéticas de otros individuos que se encuentran en el banco de germoplasma del CIDCA, el conocimiento de la información genética más distante, permitirá en algunos casos, obtener híbridos con las mejores características genéticas de sus progenitores, reduciendo al menos en un 10 % el tiempo en la obtención de nuevas variedades.

Se concluyó que el uso de marcadores moleculares DArT desarrollado para especies poliploides como caña de azúcar,

permitió realizar el análisis genético de los clones analizados.

Page 17: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

17

Bibliografía

Aguilar-Rivera, N., Galindo-Mendoza, G., Fortanelli-Martínez, J., and Contreras-Servin, C. 2010. International competitiveness of Mexico’S sugar industry. Theoria 19:7-29.

Aitken, K. S., McNeil, M. D., Hermann, S., Bundock, P. C., Kilian, A., Heller-Uszynska, K., Henry, R. J., and Li, J. 2014. A comprehensive genetic map of sugarcane that provides enhanced map coverage and integrates high-throughput Diversity Array Technology (DArT) markers. BMC Genomics 15:152. DOI: 10.1186/1471-2164-15-152.

Akbari, M., Wenzl, P., Caig, V., Carling, J., Xia, L., Yang, S., Uszynski, G., Mohler, V., Lehmensiek, A., Kuchel, H., Hayden, M. J., Howes, N., Sharp, P., Vaughan, P., Rathmell, B., Huttner, E., and Kilian, A. 2006. Diversity Arrays Technology (DArT) for high-throughput pro�ling of the hexaploid wheat genome. Theoretical and Applied Genetic 113:1409-1420.

Al-Khayri, J. M., Mohan, J. S., and Johnson, D. V. 2015. Advances in Plant Breeding Strategies: Breeding, Biotechnology and Molecular Tools. Springer International Publishing.

Berkman, P. J., Casu, R. E., Stiller, J., Rae, A. L., and Aitken, K. S. 2013. Towards the sugarcane genome sequence and an understanding of polyploid. Proc. Int. Soc. Sugar Cane Technology 28:1-10.

CONADESUCA. 2010. 2° Congreso Internacional sobre el Manejo Sustentable de la Caña de Azúcar. Proyectos INIFAP-CNIAA.

CONADESUCA. 2016. Sistema de Información de la Investigación en la Agroindustria de la Caña de Azúcar, en: http://www.siiba.conadesuca.gob.mx/siiaca/

Diatchenko, L., Lau, Y. F., Cambpbell, A. P., Chenchik, A., Moqadam, F., Huang, S., Lukyanow, S., Lukyanow, K., Gurskaya, N., Sverdlov, E. D., and Siebert, P. D. 1996. Suppression subtractive hybridization: a method for generating differentially regulated or tissue-speci�c cDNA probes and libraries. Procceding of the National Academic of Science USA 93:6025–6030.

Doyle, J. J., and Doyle, J. L. 1991. A rapid DNA isolation procedure for small quantities of fresh leaf tissue. Phytochemistry Bulletin 19:1–15.

Franco, J., Crossa, J., Taba, S., and Shands, H. A. 2005. Sampling strategy for conserving genetic diversity when forming core subsets. Crop Science 45:1035-1044.

García, A. et al. 2006. Development of an integrated genetic map of a sugarcane (Saccharum spp.) commercial cross, based on a maximum-likelihood approach for estimation of linkage and linkage phases. Theoretical and Applied Genetic 112:298-314.

García, A., Kido, E. A., Meza, A. N., Souza, H. M., Pinto, L. R., Pastina, M. M., Leite, C. S., Silva, J. A., Ulian, E. C., Figueira, A., and Souza, A. P. 2013. SNP genotyping allows an in-depth characterisation of the genome of sugarcane and other complex autopolyploids. Nature: Scienti�c Reports 3, Article number: 3399. DOI: 10.1038/srep03399.

Huang, E., Aitken, K., and George, A. 2010. Association Studies. pp. 43-68. In: Henry, R. J., and Kole, C. (eds.). Genetics, Genomics and Breeding of Sugarcane. CRC Press. Science Publishers, USA.

Jaccoud, D., Peng, K., Feinstein, D., and Kilian, A. 2001. Diversity arrays: a solid state technology for sequence information independent genotyping. Nucleic Acids Research 29:e25.

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Manners, J. M. 2011. Functional Genomics of Sugarcane. pp. 91-146. In: Jean-Claude Kader and M. Delseny (eds.). Advances in Botanical Research. Volume 60. Academic Press, USA.

McCullagh, P., and Nelder, J. A. 1989. Generalized Linear Models. Chapman and Hall, Second Edition, 511 pp.

Montesinos-López, O. A., Montesinos-López, A., Pérez-Rodríguez, P., de los Campos, G., Eskridge, K., and Crossa, J. 2015. Threshold models for genome-enabled prediction of ordinal categorical traits in plant breeding. G3-Genetics 5:291-299.

Sambrook, J., Fritsch, E. F., and Maniatis, T. 1989. Molecular cloning. A laboratory manual. Cold Spring Harbour Laboratory Press.

Wenzl, P., Carling, J., Kudrna, D., Jaccoud, D., Huttner, E., Kleinhofs, A., and Kilian, A. 2004. Diversity Arrays Technology (DArT) for whole-genome pro�ling of barley. Procceding of the National Academic of Science USA 101:9915–9920.

Wittenberg, A. H. J., Van Der Lee, T., Cayla, C., Kilian, A., Visser, R. G. F., and Schouten, H. J. 2005. Validation of the high-throughput marker technology DArT using the model plant Arabidopsis thaliana. Molecular General Genetic 274:30–39.

Xia, L., Peng, K., Yang, S., Wenzl, P., De Vicente, C., Fregene, M., and Kilian, A. 2005. DArT for high-throughput genotyping of cassava (Manihot esculenta) and its wild relatives. Theoretical and Applied Genetic 110:1092–1098.

Page 18: REPORTE DE PROYECTO · base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para ... completo; de tal manera que el dendrograma

18

Bibliografía

CONADESUCAComite Nacional para el DesarrolloSustentable de la Caña de Azúcar

Aguilar-Rivera, N., Galindo-Mendoza, G., Fortanelli-Martínez, J., and Contreras-Servin, C. 2010. International competitiveness of Mexico’S sugar industry. Theoria 19:7-29.

Aitken, K. S., McNeil, M. D., Hermann, S., Bundock, P. C., Kilian, A., Heller-Uszynska, K., Henry, R. J., and Li, J. 2014. A comprehensive genetic map of sugarcane that provides enhanced map coverage and integrates high-throughput Diversity Array Technology (DArT) markers. BMC Genomics 15:152. DOI: 10.1186/1471-2164-15-152.

Akbari, M., Wenzl, P., Caig, V., Carling, J., Xia, L., Yang, S., Uszynski, G., Mohler, V., Lehmensiek, A., Kuchel, H., Hayden, M. J., Howes, N., Sharp, P., Vaughan, P., Rathmell, B., Huttner, E., and Kilian, A. 2006. Diversity Arrays Technology (DArT) for high-throughput pro�ling of the hexaploid wheat genome. Theoretical and Applied Genetic 113:1409-1420.

Al-Khayri, J. M., Mohan, J. S., and Johnson, D. V. 2015. Advances in Plant Breeding Strategies: Breeding, Biotechnology and Molecular Tools. Springer International Publishing.

Berkman, P. J., Casu, R. E., Stiller, J., Rae, A. L., and Aitken, K. S. 2013. Towards the sugarcane genome sequence and an understanding of polyploid. Proc. Int. Soc. Sugar Cane Technology 28:1-10.

CONADESUCA. 2010. 2° Congreso Internacional sobre el Manejo Sustentable de la Caña de Azúcar. Proyectos INIFAP-CNIAA.

CONADESUCA. 2016. Sistema de Información de la Investigación en la Agroindustria de la Caña de Azúcar, en: http://www.siiba.conadesuca.gob.mx/siiaca/

Diatchenko, L., Lau, Y. F., Cambpbell, A. P., Chenchik, A., Moqadam, F., Huang, S., Lukyanow, S., Lukyanow, K., Gurskaya, N., Sverdlov, E. D., and Siebert, P. D. 1996. Suppression subtractive hybridization: a method for generating differentially regulated or tissue-speci�c cDNA probes and libraries. Procceding of the National Academic of Science USA 93:6025–6030.

Doyle, J. J., and Doyle, J. L. 1991. A rapid DNA isolation procedure for small quantities of fresh leaf tissue. Phytochemistry Bulletin 19:1–15.

Franco, J., Crossa, J., Taba, S., and Shands, H. A. 2005. Sampling strategy for conserving genetic diversity when forming core subsets. Crop Science 45:1035-1044.

García, A. et al. 2006. Development of an integrated genetic map of a sugarcane (Saccharum spp.) commercial cross, based on a maximum-likelihood approach for estimation of linkage and linkage phases. Theoretical and Applied Genetic 112:298-314.

García, A., Kido, E. A., Meza, A. N., Souza, H. M., Pinto, L. R., Pastina, M. M., Leite, C. S., Silva, J. A., Ulian, E. C., Figueira, A., and Souza, A. P. 2013. SNP genotyping allows an in-depth characterisation of the genome of sugarcane and other complex autopolyploids. Nature: Scienti�c Reports 3, Article number: 3399. DOI: 10.1038/srep03399.

Huang, E., Aitken, K., and George, A. 2010. Association Studies. pp. 43-68. In: Henry, R. J., and Kole, C. (eds.). Genetics, Genomics and Breeding of Sugarcane. CRC Press. Science Publishers, USA.

Jaccoud, D., Peng, K., Feinstein, D., and Kilian, A. 2001. Diversity arrays: a solid state technology for sequence information independent genotyping. Nucleic Acids Research 29:e25.

Después de imputar y eliminar marcadores en base a MAF se obtuvo la matriz de relaciones genómicas G, que es la base para los estudios de las relaciones entre un individuo con los 93 clones, misma que puede ser utilizada para estudios de la diversidad de la población de interés o en predicción genómica a partir de los progenitores. La matriz puede calcularse fácilmente usando la expresión siguiente:

G=ZZ'/p, …(1)

donde Z es la matriz de marcadores de dimensiones n=93 individuos y p=43, 250, que se obtiene al centrar y

estandarizar las columnas de la matriz de marcadores con 0’s y 1’s.

La Figura 6, presenta un mapa de calor (heatmap) de las 93 líneas que se obtienen usando la matriz G, los mapas de calor son adecuados para visualizar grandes cantidades de datos multidimensionales. Cada cuadro se ilumina dependiendo del valor en la matriz.

Basada en la matriz de marcadores codi�cada con 0/1, se realizó también un agrupamiento de las variedades. Primero, se calculó una matriz de distancias Euclideanas, y luego, se hizo un agrupamiento jerárquico utilizando encadenamiento completo; de tal manera que el dendrograma muestra las distancias entre los individuos con base al marcador (Fig. 7).

Las distancias genéticas entre los clones se observan en la matriz de distancias (Fig. 8).

Los resultados se presentaron al grupo de investigación de la Estación de Hibridación del CIDCA ubicada en Tuxtla Chico, Chiapas (Fig. 9).

Manners, J. M. 2011. Functional Genomics of Sugarcane. pp. 91-146. In: Jean-Claude Kader and M. Delseny (eds.). Advances in Botanical Research. Volume 60. Academic Press, USA.

McCullagh, P., and Nelder, J. A. 1989. Generalized Linear Models. Chapman and Hall, Second Edition, 511 pp.

Montesinos-López, O. A., Montesinos-López, A., Pérez-Rodríguez, P., de los Campos, G., Eskridge, K., and Crossa, J. 2015. Threshold models for genome-enabled prediction of ordinal categorical traits in plant breeding. G3-Genetics 5:291-299.

Sambrook, J., Fritsch, E. F., and Maniatis, T. 1989. Molecular cloning. A laboratory manual. Cold Spring Harbour Laboratory Press.

Wenzl, P., Carling, J., Kudrna, D., Jaccoud, D., Huttner, E., Kleinhofs, A., and Kilian, A. 2004. Diversity Arrays Technology (DArT) for whole-genome pro�ling of barley. Procceding of the National Academic of Science USA 101:9915–9920.

Wittenberg, A. H. J., Van Der Lee, T., Cayla, C., Kilian, A., Visser, R. G. F., and Schouten, H. J. 2005. Validation of the high-throughput marker technology DArT using the model plant Arabidopsis thaliana. Molecular General Genetic 274:30–39.

Xia, L., Peng, K., Yang, S., Wenzl, P., De Vicente, C., Fregene, M., and Kilian, A. 2005. DArT for high-throughput genotyping of cassava (Manihot esculenta) and its wild relatives. Theoretical and Applied Genetic 110:1092–1098.