Post on 28-Oct-2021
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL
(Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO
INTER-SUBESPECIacuteFICO
CARLOS JAVIER LOZANO CAVAZOS
T E S I S
Presentada como Requisito Parcial
para Obtener el Grado de
DOCTOR EN CIENCIAS
EN FITOMEJORAMIENTO
Universidad Autoacutenoma Agraria
ldquoAntonio Narrordquo
PROGRAMA DE GRADUADOS
Buenavista Saltillo Coahuila Meacutexico
ABRIL DE 2008
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO
SUBDIRECCIOacuteN DE POSTGRADO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRAS OL (Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO INTER-
SUBESPECIacuteFICO
T E S I S
Por
CARLOS JAVIER LOZANO CAVAZOS
Elaborada bajo la supervisioacuten del Comiteacute Particular de Asesoriacutea y aprobada como requisito parcial para obtener el grado de
DOCTOR EN CIENCIAS EN FITOMEJORAMIENTO
Comiteacute Particular
Asesor principal ______________________________ Dr M Humberto Reyes Valdeacutes
Asesor ______________________________
Dr Juan Manuel Martiacutenez Reyna Asesor ______________________________
Dr Octavio Martiacutenez de la Vega
Asesor ______________________________ Dr Alberto Flores Olivas
Asesor ______________________________
Dr Rosalinda Mendoza Villarreal
______________________________ Dr Jeroacutenimo Landeros Flores
Director de Postgrado
Buenavista Saltillo Coahuila Meacutexico Abril de 2008
ii
AGRADECIMIENTOS
A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto
fundamental en mi preparacioacuten profesional
Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de
trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad
Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute
como sus valiosas sugerencias en la realizacioacuten del presente documento
A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo
incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente
investigacioacuten asiacute como en la revisioacuten de tesis
Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte
de mi Comiteacute de Asesoriacutea
A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su
gran amistad
A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el
desarrollo de la presente investigacioacuten
A los Maestros del programa en Fitomejoramiento que me brindaron sus
conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional
A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento
por su gran apoyo y amistad a lo largo de mi estancia en el mismo
iii
DEDICATORIA
A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional
A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional
y comprensioacuten en todo momento de mi vida
A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo
momento una luz de amor y fortaleza
A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran
amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida
A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en
todo momento y proyecto de mi vida
iv
COMPENDIO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus
annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO
Por
CARLOS JAVIER LOZANO CAVAZOS
DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008
Dr M Humberto Reyes Valdeacutes---Asesor---
Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-
subespeciacutefica QTL
El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite
a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de
material silvestre El descubrimiento de restos de girasol domesticado de
aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen
de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al
este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de
caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos
relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de
planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten
v
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO
SUBDIRECCIOacuteN DE POSTGRADO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRAS OL (Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO INTER-
SUBESPECIacuteFICO
T E S I S
Por
CARLOS JAVIER LOZANO CAVAZOS
Elaborada bajo la supervisioacuten del Comiteacute Particular de Asesoriacutea y aprobada como requisito parcial para obtener el grado de
DOCTOR EN CIENCIAS EN FITOMEJORAMIENTO
Comiteacute Particular
Asesor principal ______________________________ Dr M Humberto Reyes Valdeacutes
Asesor ______________________________
Dr Juan Manuel Martiacutenez Reyna Asesor ______________________________
Dr Octavio Martiacutenez de la Vega
Asesor ______________________________ Dr Alberto Flores Olivas
Asesor ______________________________
Dr Rosalinda Mendoza Villarreal
______________________________ Dr Jeroacutenimo Landeros Flores
Director de Postgrado
Buenavista Saltillo Coahuila Meacutexico Abril de 2008
ii
AGRADECIMIENTOS
A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto
fundamental en mi preparacioacuten profesional
Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de
trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad
Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute
como sus valiosas sugerencias en la realizacioacuten del presente documento
A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo
incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente
investigacioacuten asiacute como en la revisioacuten de tesis
Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte
de mi Comiteacute de Asesoriacutea
A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su
gran amistad
A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el
desarrollo de la presente investigacioacuten
A los Maestros del programa en Fitomejoramiento que me brindaron sus
conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional
A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento
por su gran apoyo y amistad a lo largo de mi estancia en el mismo
iii
DEDICATORIA
A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional
A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional
y comprensioacuten en todo momento de mi vida
A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo
momento una luz de amor y fortaleza
A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran
amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida
A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en
todo momento y proyecto de mi vida
iv
COMPENDIO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus
annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO
Por
CARLOS JAVIER LOZANO CAVAZOS
DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008
Dr M Humberto Reyes Valdeacutes---Asesor---
Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-
subespeciacutefica QTL
El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite
a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de
material silvestre El descubrimiento de restos de girasol domesticado de
aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen
de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al
este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de
caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos
relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de
planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten
v
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
AGRADECIMIENTOS
A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto
fundamental en mi preparacioacuten profesional
Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de
trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad
Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute
como sus valiosas sugerencias en la realizacioacuten del presente documento
A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo
incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente
investigacioacuten asiacute como en la revisioacuten de tesis
Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte
de mi Comiteacute de Asesoriacutea
A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su
gran amistad
A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el
desarrollo de la presente investigacioacuten
A los Maestros del programa en Fitomejoramiento que me brindaron sus
conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional
A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento
por su gran apoyo y amistad a lo largo de mi estancia en el mismo
iii
DEDICATORIA
A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional
A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional
y comprensioacuten en todo momento de mi vida
A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo
momento una luz de amor y fortaleza
A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran
amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida
A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en
todo momento y proyecto de mi vida
iv
COMPENDIO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus
annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO
Por
CARLOS JAVIER LOZANO CAVAZOS
DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008
Dr M Humberto Reyes Valdeacutes---Asesor---
Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-
subespeciacutefica QTL
El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite
a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de
material silvestre El descubrimiento de restos de girasol domesticado de
aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen
de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al
este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de
caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos
relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de
planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten
v
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
DEDICATORIA
A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional
A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional
y comprensioacuten en todo momento de mi vida
A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo
momento una luz de amor y fortaleza
A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran
amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida
A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en
todo momento y proyecto de mi vida
iv
COMPENDIO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus
annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO
Por
CARLOS JAVIER LOZANO CAVAZOS
DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008
Dr M Humberto Reyes Valdeacutes---Asesor---
Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-
subespeciacutefica QTL
El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite
a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de
material silvestre El descubrimiento de restos de girasol domesticado de
aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen
de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al
este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de
caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos
relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de
planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten
v
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
COMPENDIO
ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus
annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO
Por
CARLOS JAVIER LOZANO CAVAZOS
DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008
Dr M Humberto Reyes Valdeacutes---Asesor---
Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-
subespeciacutefica QTL
El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite
a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de
material silvestre El descubrimiento de restos de girasol domesticado de
aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen
de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al
este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de
caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos
relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de
planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten
v
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo
por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol
cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre
ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten
F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo
experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los
anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de
ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre
581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos
publicados este representa aproximadamente el 4373 del promedio del genoma de
Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un
QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se
identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud
de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del
mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y
peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al
119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de
marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero
de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El
vi
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a
traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica
de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten
con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a
variedades de girasol elite
vii
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
ABSTRACT
QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus
L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS
By
CARLOS JAVIER LOZANO CAVAZOS
DOCTOR OF SCIENCE IN PLANT BREEDING
UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008
PhD M Humberto Reyes Valdeacutes--Adviser---
Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross
QTL
The improvement of cultivated sunflower the second largest oilseed crop in the
world depends largely on the introduction of genetic diversity from wild species The
discovery of 4000 years old domesticated sunflower remains from San Andreacutes
Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico
than eastern North America The purpose of the present study was to detect quantitative
trait loci (QTLrsquos) positions and its genetic effects especially those related with
sunflower domestication Eight traits were evaluated and analyzed by interval mapping
plant height branching head diameter number of achenes achene weight days to
flowering days to physiological maturity and seed oil content in a population of 149
viii
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus
annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo
(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were
grown in field conditions by using a random incomplete block design with two
replications QTL analyses were carried out in MapQTL 40 in a low-density genetic
linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups
and it represents approximately 4337 of the average Helianthus annuus L genome
according to the genetic linkage maps published up to date A genome-wide statistical
significance of 005 was used to detect QTLrsquos To determine the empirical significance
threshold values permutation tests were performed only in linkage groups showing a
LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus
for each trait evaluated was carried out to determine any possible association marker-
trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene
weight was identified Likewise interval mapping identified five putative QTLrsquos (those
showing a linkage group-wide statistical significance lt 005 but with a genome-wide
statistical significance gt 005) for plant height branching head diameter number of
achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the
phenotypic variance for five traits evaluated Single-marker analyses identified highly
significantly (P lt0001) four unlinked loci for number of achenes and days to
physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to
4310 by the Blight and Dyer method This work will contribute to the knowledge of
the genetics of sunflower domestication and it will generate markers for selection with
breeding purposes aimed to wild trait introgression in elite sunflower cultivars
ix
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
IacuteNDICE DE CONTENIDO
Paacutegina
IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii
IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv
I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1
11 Objetivos ----------------------------------------------------------------------------- 4
II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5
21 Origen del girasol cultivado ------------------------------------------------------- 5
22 Taxonomiacutea --------------------------------------------------------------------------- 6
23 Distribucioacuten geograacutefica------------------------------------------------------------- 7
24 Especiacioacuten del girasol ------------------------------------------------------------- 7
25 Poblaciones de mapeo -------------------------------------------------------------- 9
26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11
27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13
2711 Anaacutelisis de marcador individual --------------------------------------------- 13
2712 Mapeo por intervalos ---------------------------------------------------------- 15
28 LOD score --------------------------------------------------------------------------- 19
29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22
x
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
292 Pruebas de permutacioacuten---------------------------------------------------------- 23
293 Valores de P ajustados ----------------------------------------------------------- 25
294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27
210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29
21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29
211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31
III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34
31 Antecedentes de investigacioacuten ---------------------------------------------------- 34
311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34
312 Genotipificacioacuten ------------------------------------------------------------------ 34
313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35
314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35
32 Localizacioacuten experimental -------------------------------------------------------- 37
33 Material geneacutetico ------------------------------------------------------------------- 37
34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38
35 Caracteres evaluados --------------------------------------------------------------- 40
36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46
37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47
IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48
V CONCLUSIONES ---------------------------------------------------------------------- 58
VI RESUMEN ----------------------------------------------------------------------------- 59
xi
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
VII LITERATURA CITADA ---------------------------- -------------------------------- 63
VIII APEacuteNDICE --------------------------------------------------------------------------- 74
xii
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
IacuteNDICE DE CUADROS
Cuadro Paacutegina
41 Cuadrados medios para seis caracteres relacionados a la
domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50
42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos
para caracteres relacionados a la domesticacioacuten del girasol en una
poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54
43 Loci marcadores no ligados con significancia al 0001 de
probabilidad para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de
marcador individual (ANOVA) -------------------------------------------- 56
xiii
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
IacuteNDICE DE FIGURAS
Figura Paacutegina
31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro
en Navidad N L-------------------------------------------------------------
39
32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y
Dyer --------------------------------------------------------------------------- 43
41 Perfiles de un QTL con significancia de amplitud genoacutemica para
peso de aquenios en el grupo de ligamiento 11 denominado PA-
G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica
explicada por el QTL () y (D) media estimada de la distribucioacuten
del caraacutecter peso de aquenios (g) ------------------------------------------ 52
xiv
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433
I INTRODUCCIOacuteN
El este de Norteameacuterica es una de al menos seis regiones del mundo donde se
piensa que la agricultura se originoacute de manera independiente La principal evidencia de
esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico
especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como
el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento
de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes
Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten
con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre
el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)
Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos
geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo
geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten
genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una
representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un
cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa
geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en
un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el
tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y
una estrategia para la clasificacioacuten de genotipos
Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido
evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del
tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El
enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un
caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue
una distribucioacuten normal (Lander y Botstein 1989)
La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es
de suma importancia para proporcionar un medio de respuesta con respecto al control
geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la
variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a
traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma
densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos
perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba
Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de
acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados
Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos
estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o
regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la
informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el
2
anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y
varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se
basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre
estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud
o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como
variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un
anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo
para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones
genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten
ambiental
La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto
del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y
la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en
los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los
caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos
factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como
objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y
(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)
especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten
de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido
de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la
3
semilla es un caraacutecter determinado predominantemente por el genotipo materno como
lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de
aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et
al 2007)
El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de
la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten
asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior
se plantearon los siguientes objetivos
11 Objetivos
1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)
2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la
domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)
Cockerell)
3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para
determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica
4
II REVISIOacuteN DE LITERATURA
21 Origen del girasol cultivado
Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba
restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser
1978) En lo que respecta al girasol cultivado se han encontrado aquenios en
investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y
Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol
fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un
origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)
Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los
resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual
monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol
domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin
embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un
origen uacutenico en Estados Unidos
22 Taxonomiacutea
De acuerdo con el Departamento de Agricultura de los Estados Unidos de
Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera
Reino Plantae
Divisioacuten Magnoliophyta
Clase Magnoliopsida
Subclase Asterideae
Orden Asterales
Familia Asteraceae
Tribu Heliantheae
Geacutenero Helianthus
Especie H annuus
Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias
fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas
capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En
contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)
producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de
aquenios de 95 a 105 mm (Burke et al 2002)
6
23 Distribucioacuten geograacutefica
El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se
encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta
subaacuterticas (Jan et al 1998 Lawson et al 1998)
Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y
poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas
calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones
ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra
ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y
de haacutebitat (Arias y Rieseberg 1995)
Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H
arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H
californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el
norte de Meacutexico y Baja California
24 Especiacioacuten del girasol
La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre
poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard
2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la
subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica
7
(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la
especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin
1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la
adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001
Navarro y Barton 2003)
Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten
simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente
distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones
de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones
cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos
arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat
se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido
innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han
originado al menos tres especies diploides estabilizadas que son fuertemente
divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos
y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo
haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et
al 1990 Rieseberg 1991)
Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies
de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a
la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las
cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo
8
anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser
adaptativa
25 Poblaciones de mapeo
Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten
de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas
homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten
del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2
de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes
(RILrsquos)
Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales
poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et
al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que
ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la
influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de
progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la
autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a
la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)
Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los
dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de
intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza
9
ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser
diferenciados de los efectos de dominancia
Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada
comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de
plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son
completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie
numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos
replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten
permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los
efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las
proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto
puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci
marcadores
Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones
homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a
traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas
generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta
que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja
de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en
efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo
considerable y no es posible que la totalidad de los individuos sean homocigotos en
todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute
10
apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de
QTLrsquos
26 Seleccioacuten del modelo geneacutetico
Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo
con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de
efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se
relaciona a la particioacuten de la varianza geneacutetica
Se han propuesto numerosos modelos para describir esta relacioacuten algunos se
basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en
una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza
geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que
los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera
independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es
definido e interpretado
Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)
utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA
Aa y aa en un locus
amicro0Gdmicro1Gamicro2G minus=+=+=
11
En este modelo a es el efecto aditivo definido como la mitad de la diferencia
entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido
como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico
homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos
solamente como una funcioacuten de los valores genotiacutepicos
El objetivo del modelo es el de proporcionar una forma para resumir e interpretar
las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada
en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del
anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten
de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de
miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media
poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos
de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de
suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la
heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer
criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos
27 Mapeo de QTLrsquos
El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas
que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una
poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables
en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos
12
(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el
tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la
estimacioacuten de medias fenotiacutepicas y varianzas
El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones
biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere
utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas
autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada
de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23
(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia
representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el
poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los
procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y
Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993
1994) involucran pruebas de hipoacutetesis nula
271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos
2711 Anaacutelisis de marcador individual
El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci
marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero
de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores
geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y
Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan
13
una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la
frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se
debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado
Los anaacutelisis de marcador individual son auacuten utilizados como un medio para
identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas
aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones
genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones
grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman
et al 1996 Varshney et al 2000)
El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la
asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al
1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)
el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no
estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son
probablemente subestimados ya que estos son confundidos con las frecuencias de
recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere
de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante
este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones
entre marcadores de DNA y caracteres cuantitativos
El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para
estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de
14
maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y
Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en
marcadores individuales no puede determinar la posicioacuten del QTL con respecto al
marcador
La ventaja principal del anaacutelisis de varianza en un loci marcador es su
simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo
puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de
cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el
mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por
separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se
indica observando solamente cuales marcadores proporcionan las mayores diferencias
entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute
mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el
marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el
marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten
de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados
2712 Mapeo por intervalos
Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el
cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un
cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el
genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se
15
basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el
efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y
genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores
verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)
(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un
modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del
QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume
normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un
valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites
del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado
intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de
razoacuten de verosimilitud basada en la hipoacutetesis
0b1Hy0b0H nelowast=lowast
Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en
efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue
localizado en el punto de consideracioacuten
Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un
procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos
cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los
intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes
16
de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los
QTLrsquos
Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en
maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo
de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede
ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de
este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de
QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten
sesgada de los QTLrsquos disminuyendo el poder de la prueba
Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre
liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de
simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y
regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud
pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda
computacional
El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de
varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL
(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)
proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de
este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo
este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por
17
intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro
de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se
encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un
intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de
manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si
existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada
seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos
identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992
Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la
vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es
utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de
QTLrsquos comparables (Knapp et al 1990)
Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda
mucho tiempo computacional y produce resultados similares con respecto a los
obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores
maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de
deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud
para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)
De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual
El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM
puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples
QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992
18
Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el
estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras
regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos
identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar
solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la
informacioacuten de otros marcadores
En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una
mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos
diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten
fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los
cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo
marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos
perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por
intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la
hipoacutetesis alternativa
28 LOD score
La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede
evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de
verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein
(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el
LOD score como un estadiacutestico de prueba)
19
El LOD score (logaritmo de los momios es el logaritmo base 10 de la
verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten
segregando de manera independiente) muestra la evidencia de la presencia de un QTL en
una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico
predeterminado en un grupo de ligamiento un QTL es detectado
En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal
mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la
razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD
score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD
score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores
ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de
manera marcada de la distribucioacuten normal
29 Significancia estadiacutestica (Prueba de hipoacutetesis)
Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos
individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se
determina la verosimilitud del evento La base estadiacutestica de estas comparaciones
depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores
del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta
distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de
distribuciones normales (Doerge et al 1997)
20
Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar
un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen
1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el
comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del
estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de
significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados
significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no
parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en
simulacioacuten (Lander y Kruglyak 1995)
La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el
meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de
aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier
estadiacutestico de prueba bajo la hipoacutetesis nula
En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores
permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa
geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten
genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y
fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos
bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten
ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados
en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van
Ooijen 1999 Doerge y Rebai 1996)
21
291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula
Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos
eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba
muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de
significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean
realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico
del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin
embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto
por intervalos
Para lograr un nivel de significancia total α para la prueba con M intervalos
puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada
intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud
sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del
tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo
geneacutetico de cada intervalo
Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad
del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos
pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y
Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)
22
Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con
respecto al observado LOD scores mayores resultan en valores pequentildeos de P los
cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD
score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces
mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten
especiacutefica
Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el
cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo
depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y
espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la
informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos
292 Pruebas de permutacioacuten
Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede
utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el
anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un
remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos
los datos de marcadores
La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un
problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es
ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al
23
2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000
permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P
ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000
permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a
un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace
suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen
de los datos observados de modo que estos deben ser analizados por el meacutetodo de
Monte Carlo para cada estudio
El algoritmo para generar un valor criacutetico basado en permutaciones es el
siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos
(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de
los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con
el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado
de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)
para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en
el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba
(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente
1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico
(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a
mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico
estimado del experimento para controlar el error tipo I a nivel α Con 005α = y
1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor
24
criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener
un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden
de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge
1994)
293 Valores de P ajustados
Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de
LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo
para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un
perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la
presencia de un QTL en esa posicioacuten (Lystig 2003)
Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el
meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo
empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para
controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un
valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para
los valores LOD score individuales Es importante conocer la significancia de amplitud
genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados
en la curva LOD score (Westfall y Young 1993)
25
La interpretacioacuten de un valor de P ajustado para un LOD score en particular
dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD
score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en
cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)
Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera
solamente la significancia marginal del LOD score para un punto de anaacutelisis en
particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma
Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte
Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo
del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay
presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la
informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente
Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por
(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor
simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente
(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la
proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se
puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un
LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron
ordenados secuencialmente en el inciso (e)
26
Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al
algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis
genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de
prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N
Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo
pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un
conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones
utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que
ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a
partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula
aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores
criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig
2003) En resumen los valores ajustados de P proporcionan niveles precisos de
significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan
un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos
geneacuteticos de caracteres cuantitativos
294 Intervalos de confianza para QTLrsquos
Un intervalo de confianza puede ser utilizado para identificar una regioacuten
cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un
QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza
27
para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap
descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es
utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del
QTL asumiendo que existe el efecto del QTL
210 QTLrsquos muacuteltiples
Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples
son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos
pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos
Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran
medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los
casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en
la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples
Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)
considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un
QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar
epistaacuteticamente con otro QTL (Doerge 2002)
La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten
numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)
(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a
28
traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con
cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda
multidimensional genoacutemica
Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de
manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten
residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar
QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)
(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)
2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples
21011 Regresioacuten muacuteltiple
Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci
marcadores y lo maacutes importante este requiere de datos completos de genotipos
marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica
debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control
depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng
1993)
21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple
(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de
QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado
29
del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el
intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos
de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que
puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de
regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos
QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)
(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten
muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando
alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de
QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la
cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia
del mapeo geneacutetico (Zeng 1993)
(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se
reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la
prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en
la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el
poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)
(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el
valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten
correlacionados a menos que los dos marcadores generalmente sean marcadores
30
adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos
intervalos para un intervalo de prueba
Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un
intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de
prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng
1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos
estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute
relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de
prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo
(Zeng 1993)
211 Mapeo muacuteltiple por intervalos
Este enfoque proporciona un medio detallado para estimar los paraacutemetros
geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones
segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y
epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al
1999)
El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores
genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser
utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el
modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo
31
de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se
puede mejorar la precisioacuten y poder del mapeo de QTL
De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos
y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes
faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples
con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la
buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples
y sus contribuciones a la varianza geneacutetica
MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre
marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre
QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y
VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas
1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro
componentes
a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos
dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)
b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico
c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres
cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y
covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico
seleccionado
32
d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de
individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los
valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por
marcadores
33
III MATERIALES Y MEacuteTODOS
31 Antecedentes de investigacioacuten
311 Formacioacuten de la poblacioacuten de mapeo
La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por
149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada
HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre
identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una
poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la
Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las
plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas
para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con
una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)
312 Genotipificacioacuten
La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en
longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el
protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR
(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de
investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)
313 Construccioacuten del mapa geneacutetico
Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg
versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en
especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el
registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de
la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la
segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram
2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de
recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi
(1944)
314 Anaacutelisis de ligamiento
De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se
obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194
procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268
polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo
2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso
molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol
35
En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas
obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se
eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P
para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de
polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas
para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y
64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de
bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045
lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente
133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)
En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de
ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de
ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de
recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad
El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento
entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten
son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de
ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se
obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un
origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere
que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-
representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron
36
una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado
debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que
muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en
esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico
El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el
4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes
mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995
Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002
Langar et al 2003 Yu et al 2003)
32 Localizacioacuten experimental
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad
Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo
O con altitud de 1895 m
33 Material geneacutetico
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
37
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2)
34 Evaluacioacuten fenotiacutepica replicada
Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en
primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en
condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La
distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente
(Figura 31)
Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y
superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia
de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo
del cultivo
Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por
parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos
plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia
completa a lo largo del ciclo del cultivo
38
Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria
Antonio Narro en Navidad N L
Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de
una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo
anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute
un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y
una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol
(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de
cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela
por planta para evitar cualquier contaminacioacuten por polen
35 Caracteres evaluados
En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa
identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de
todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales
para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta
para evitar cualquier contaminacioacuten por polen
Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a
madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten
de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los
cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos
se basoacute en dos mediciones perpendiculares considerando solamente el promedio de
estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23
(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto
40
a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo
dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza
respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se
evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos
muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos
En el Cuadro A2 se muestran las medias solamente para seis caracteres
evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de
aquenios peso de aquenios y contenido de aceite de aquenios)
La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para
cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada
planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas
presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de
cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores
liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez
fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se
tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios
fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el
nuacutemero y peso de aquenios
Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para
extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca
41
cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y
es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente
a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70
ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)
b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten
c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa
d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso
constante
e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de
cloroformo dentro de un matraz bola fondo plano a peso constante
g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos
ExtraccioacutenPrimera
ExtraccioacutenSegunda
ExtraccioacutenTercera
42
Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de
muestra (g)
A B
A y B
Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)
C
D
D
Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante
EF
F
( ) ( )100
SecaMuestra de Gramos
MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=
36 Disentildeo experimental y anaacutelisis estadiacutestico
El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques
incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38
parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron
repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal
( ) ijkijkijiijk EGRFRGY +++++= micro
Donde
micro = media general
i = 1 2hellip g (grupos)
j = 1 2 (repeticiones)
k = 1 2hellip f (familias)
iG = efecto del i-eacutesimo grupo
jR = efecto de la j-eacutesima repeticioacuten
kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo
( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten
ijkE = efecto del error experimental
ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima
repeticioacuten
46
Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten
260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar
diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos
incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-
subespeciacuteficos
37 Anaacutelisis geneacutetico
Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores
individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core
Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada
caraacutecter evaluado
En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por
intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus
efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al
2002)
Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y
Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba
solamente para aquellos grupos de ligamiento con un LOD score mayor que 15
47
IV RESULTADOS Y DISCUSIOacuteN
Liacuteneas endogaacutemicas recombinantes (RILrsquos)
De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3
en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93
aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total
El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas
Anaacutelisis estadiacutestico
Evaluacioacuten fenotiacutepica replicada
Se observaron diferencias significativas en cuanto a repeticiones solamente para
el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16
(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de
planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a
00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican
significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por
grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P
igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de
capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo
significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron
diferencias significativas entre familias dentro de grupos para los caracteres altura de
planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos
caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y
contenido de aceite de aquenios se detectaron diferencias significativas con un valor de
P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias
dentro de grupos (Cuadro 41)
De acuerdo a las diferencias significativas encontradas entre familias dentro de
grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la
poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios
en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)
reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol
silvestre
Anaacutelisis geneacutetico
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador
M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute
un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica
(Figuras 41B y 41C)
49
Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
Caracteres evaluadosdagger
FV AP NC DC NA PA CA
Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397
Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928
Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS
Familiasgrupos 00895 2860 2470 1003 1214 000465
Error Residual 00190 341 1138 708 0166 000072
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g) CA = contenido de aceite de aquenios ()
Significativo al 005 de probabilidad
Significativo al 001 de probabilidad
Significativo al lt0001 de probabilidad
NS = No significativo
Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al
marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de
ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a
PA-G11 (Cuadro 42 Figura 41C)
Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten
fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos
distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de
planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y
nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza
fenotiacutepica observada (Cuadro 42)
Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-
G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al
progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos
pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en
cuanto a LOD score (le114) detectados para el contenido de aceite se debieron
probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el
mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este
caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el
efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los
alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-
G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)
51
Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11
denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de
la distribucioacuten del caraacutecter peso de aquenios (g)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
20
0 10 20 30
Distancia mapa ( cM )
LOD score (A)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
00
10
0 10 20 30
Distancia mapa ( cM )
Efectos aditivos (B)
Figura 41 Continuacioacutenhelliphelliphellip
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa ( cM )
Porcentaje de la varianza
fenot iacute pica (C)
10 20 30 40 50 60 70 80 90
100 110 120
0 10 20 30
Distancia mapa
Porcentaje de la varianza
fenot iacute pica (C)
( cM )
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
00
10
0 10 20 30
Distancia mapa ( cM )
PA ndash Girasol cultivado PA ndash Girasol silvestre (D)
Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del
girasol en una poblacioacuten segregante F2F3
Mapeo por Intervalos
Caraacutecterdagger QTLdaggerdagger Posicioacuten
(cM) daggerdaggerdagger
Locus Marcador
Flanqueante Lod score PVFpara AGφ ACφφ
Efectos
Aditivos
AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084
NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146
DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724
NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463
PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776
PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332
dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de
aquenios (g)
daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento
geneacutetico
daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante
para Porcentaje de la varianza fenotiacutepica explicada por el QTL
φ Significancia estadiacutestica de amplitud genoacutemica
φφ Significancia estadiacutestica de amplitud cromosoacutemica
Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos
en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al
genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por
lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo
geneacutetico
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico
asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente
asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter
diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT
M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo
anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el
anaacutelisis de ligamiento
Por otra parte se registraron asociaciones QTL-marcador de manera significativa
al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci
marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT
M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres
diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra
parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del
progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y
250 respectivamente (Cuadro 43)
55
Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para
caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3
a traveacutes del meacutetodo de marcador individual (ANOVA)
Marcador Individual (ANOVA)
Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador
AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT
AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT
DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT
DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT
DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT
DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT
NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT
PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT
PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT
DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT
DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT
DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA
DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT
DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT
DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC
DMF M162P1E-AGGM-CAC
dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de
aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez
fisioloacutegica CA = contenido de aceite de aquenios ()
56
Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de
pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de
marcadores individuales para peso de aquenios con diferente combinacioacuten de bases
restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)
57
V CONCLUSIONES
Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3
en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas
recombinantes (RILrsquos)
La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten
Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente
al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P
lt0001
El mapeo por intervalos identificoacute un QTL con significancia de amplitud
genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a
nivel sugestivo
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 a traveacutes del meacutetodo Blight y Dyer
VI RESUMEN
La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma
importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de
los caracteres cuantitativos
El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y
estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten
del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de
capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y
contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de
liacutepidos propuesto por Bligh y Dyer (1959)
El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio
Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W
con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de
transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola
Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L
localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m
Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas
derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un
material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado
como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue
bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de
38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores
incluyeron repeticiones grupos y familias
Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro
plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas
recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios
por liacutenea
Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40
tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en
marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud
genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los
estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos
grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten
caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada
caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)
El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)
identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas
60
consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres
evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al
caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez
fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-
CTT)
Se registraron asociaciones QTL-marcador de manera significativa al 0001 de
probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para
siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes
Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor
HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250
respectivamente
Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso
de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17
grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos
diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados
(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco
caracteres evaluados
El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a
4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del
girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de
61
mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de
girasol elite
62
VII LITERATURA CITADA
Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and
wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-
248
Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K
Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of
Helianthus annuus L2 Construction of a RFLP linkage map for cultivated
sunflower Theoretical and Applied Genetics 91195-199
Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and
purification Canadian Journal of Biochemistry and Physiology 37(8)911-917
Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of
sunflower domestication Genetics 1611257-1267
Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J
Knapp and L H Rieseberg 2004 Comparative mapping and rapid
karyotypic evolution in the genus Helianthus Genetics 167449-457
Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection
during the evolution of cultivated sunflower Genetics 1711933-1940
Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for
simultaneous mapping of multiple interacting quantitative trait loci Genetics
1552003-2010
Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus
L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN
Buenavista Saltillo Coahuila Meacutexico 46 p
Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative
trait mapping Genetics 138963-971
Cockerham C C 1954 An extension of the concept of partitioning hereditary variance
for analysis of covariances among relatives when epistasis is present Genetics
39859-882
Darvasi A and J I Weller 1992 On the use of the moments method of estimation to
obtain approximate maximum likelihood estimation of linkage between a genetic
marker and a quantitative locus Heredity 6843-46
Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray
London)
Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a
quantitative character Genetics 142285-294
Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests
Heredity 76459-464
Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental
populations Nat Rev 343-52
Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes
affecting quantitative traits in experimental populations Stat Sci 12(3)195-219
Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and
Hall New York)
Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic
models from parental F1 and backcross data Genetics 73695-711
64
Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4
Longman Harlow UK
Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that
avoids spurious LOD score peaks Genetics 167959-965
Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)
Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436
Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-
373
Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a
consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)
Theor Appl Genet 901079-1086
Haley C S and S A Knott 1992 A simple regression method for mapping
quantitative trait loci in line crosses using flanking markers Heredity 69315-
324
Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in
crosses between outbred lines using least squares Genetics 1361195-1207
Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten
maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex
30(1)39-42
Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg
2004 Origin of extant domesticated sunflowers in eastern North America
Nature 430201-204
Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower
Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp
31-53
65
Hill A P 1975 Quantitative linkage A statistical procedure for its detection and
estimation Ann Hum Genet Land 38439-559
Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic
markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85
953-960
Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of
an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22
Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135
205-211
Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of
multiple quantitative trait genes using molecular marker information
Dissertation of Department of Statistics at North Carolina State University
Kao C-H 2000 On the differences between maximum likelihood and regression
interval mapping in the analysis of quantitative trait loci Genetics 156855-865
Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University
Press Ames Iowa
Kosambi D D 1944 The estimation of map distances from recombination values
Annals of Eugenics 12172-175
Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using
molecular marker linkage maps Theor Appl Genet 79583-592
Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L
Newburg 1987 MAPMAKER an interactive computer package for constructing
primary genetic linkage maps of experimental and natural populations Genomics
1174-181
Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative
traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)
66
Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for
interpreting and reporting linkage results Nat Genet 11241-247
Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003
Combined mapping of DALP and AFLP markers in cultivated sunflower using
F9 recombinant inbred lines Theor Appl Genet 1061068-1074
Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998
Marker-assisted selection for two rust resistance genes in sunflower Mol Breed
4227-234
Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil
concentrations across generations and environments in sunflower (Helianthus
annuus L) Crop Science 43135-140
Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower
(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376
Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage
between a marker gene and a quantitative locus II Application to backcross and
doubled haploid populations Heredity 66117-124
Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687
Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons
from Drosophila bristles BioEssays 18113-121
Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the
effects of quantitative trait loci using flanking markers Theor Appl Genet
85480-488
Mcmillan I and A Robertson 1974 The power of methods for the detection of major
genes affecting quantitative traits Heredity 32349-356
Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi
2002 Mapping and analysis of quantitative trait loci for grain oil content and
67
agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)
Theor Appl Genet 106149-156
Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in
parapatry a new twist on chromosomal speciation Evolution 57447-459
Nettleton D and R W Doerge 2000 Accounting for variability in the use of
permutation testing to detect quantitative trait loci Biometrics 5652-58
Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal
inversions and the persistence of species Proc Natl Acad Sci USA 9812084-
12088
Orr H A 1998a The population genetics of adaptation the distribution of factors fixed
during adaptive evolution Evolution 52935-949
Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution
using quantitative trait locus data Genetics 1492099-2104
Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat
140725-742
Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev
1413-37
Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of
quantitative trait loci using selected overlapping recombinant chromosomes in an
interspecies cross of tomato Genetics 124735-742
Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of
a sunflower Can J Genet Cytol 6293-297
Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292
2260-2261
68
Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R
Quitmyer 2001 Origin and environmental setting of ancient agriculture in the
lowlands of Mesoamerica Science 2921370-1373
R Development Core Team 2006 R A language and environment for statistical
computing R Foundation for Statistical Computing Vienna Austria
httpwwwR-projectorg
Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval
mapping tests for QTL detection Genetics 138235-240
Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for
QTL detection Biometrics 5187-99
Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and
development of the domesticated sunflower (Helianthus annuus Asteraceae)
Econ Bot 4479-91
Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized
hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44
1498-1511
Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from
ribosomal genes Am J Bot 781218-237
Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato
J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major
ecological transitions in wild sunflowers facilitated by hybridization Science
3011211-1216
Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en
girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento
cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo
Coahuila Meacutexico 73 p
69
Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg
2002 Phenotypic differentiation between three ancient hybrid taxa and their
parental species Int J Plant Sci 163387-98
Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian
approach to detect quantitative trait loci using Markov Chain Monte Carlo
Genetics 144 805-816
Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop
Science 21901-903
Seiler G J 1992 Utilization of wild sunflower species for the improvement of
cultivated sunflower Field Crop Research 30195-230
Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources
of the wild and domesticated sunflower ASA CSSA SSSA Sunflower
Technology and Production Agronomy Monograph no 35 Madison WI USA
pp21-65
Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design
from an information perspective Genetics 170447-464
Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in
annual sunflowers Implications for adaptive trait introgression Genetics
153965-977
Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus
(Compositae) Taxon 30393-403
Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling
bristle score in Drosophila melanogaster I Allocation of third chromosome
sternopleural bristle effects to chromosome sections Genetics 118437-443
Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci
from incomplete outbred offspring data Genetics 1511605-1619
70
Soller M T Brody and A Genizi 1976 In the power of experimental designs for the
detection of linkage between marker loci and quantitative loci in crosses between
inbred lines Theor Appl Genet 4735-39
Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple
sequence repeat map of the sunflower genome Theor Appl Genet 1051124-
1136
Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil
percentage in sunflower Crop Science 19617-619
Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C
Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight
in pea (Pisum sativum L) Theor Appl Genet 93431-439
Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using
Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-
743
United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04
de marzo de 2008
Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental
populations of diploid species Heredity 83613-624
Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the
calculation of genetic linkage maps Plant Research International Wageningen
the Netherlands
Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40
Software for the calculation of QTL positions on genetic maps Plant Research
International Wageningen The Netherlands
Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000
Identification of eight chromosomes and a microsatellite marker on 1AS
71
associated with QTL for grain weight in bread wheat Theor Appl Genet
81290-1294
Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL
mapping by bootstrapping Genetics 1431013-1020
Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J
Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for
DNA fingerprinting Nucleic Acids Res 234407-414
Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an
interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon
pimpinellifolium) by means of genetic markers Genetics 118329-339
West-Eberhard M J 2005 Developmental plasticity and the origin of species
differences Proc Natl Acad Sci USA 1026543-6549
Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples
and Methods for P-Value Adjustment John Wiley and Sons New York
Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc
Xu S 1995 A comment on the simple regression method for interval mapping
Genetics 1411657-1659
Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F
Han W C Chu D M Webb L Thompson K J Edwards S Berry A J
Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a
saturated molecular genetic linkage map for cultivated sunflower Crop Science
43367-387
Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in
mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976
Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468
72
Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent
developments Genetica 12325-37
Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of
quantitative traits Genet Res 74279-289
Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and
interpretation of models Genetics 1691711-1725
Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating
phenotypes of F3 progeny Genetics 1661981-1993
Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for
assessing genome-wide statistical significance in mapping quantitative trait loci
Genetics 1682307-2316
73
VIII APEacuteNDICE
Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol
cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con
marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
30538
31658
M243P1E - AGCM - CAT 0000
M84P1E - AGCM - CAT 30538
M84P2E - ACCM - CAT 62196
G2
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
19311
1191
13343
22277
9000
M170P1E - ACCM - CTT 0000
M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502
M258P1E - ACCM - CAC 33845
M114P1E - ACCM - CAC 56122
M138P1E - ACCM - CTT 65122
G1
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
28524
28973
M263P1E - ACCM - CAT 0000
M186P2E - ACCM - CAT 28524
M297P1E - ACCM - CTT 57497
G3
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
30215
M434P1E - ACGM - CAA 0000
M205P2E - ACCM - CAA 30215
G4
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
32865
M129P1E - ACCM - CAA 0000
M197P2E - AGCM - CAA 32865
G5
Figura A1 Continuacioacutenhelliphelliphellip
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
22082
M181P1E - ACCM - CAC 0000
M98P1E - ACCM - CAC 22082
G7
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30793
M64P2E - ACAM - CAG 0000
M77P2E - ACAM - CAG 3 0793
G8
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
30625
M82P1E - ACAM - CAG 0000
M170P1E - ACAM - CAG 30625
G9
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
25712
M376P1E - ACGM - CAA 0000
M166P1E - ACGM - CAA 25712
G10
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
33923
M123P1E - ACCM - CTT 0000
M181P1E - ACCM - CTT 33923
G6
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30506
M208P1E - ACCM - CAC 0000
M169P1E - ACCM - CAC 30506
G11
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
30543
M323P1E - AGGM - CAC 0000
M320P1E - ACCM - CAT 30543
G12
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
24067
M320P1E - AGCM - CAA 0000
M86P2E - AGGM - CAC 24067
G13
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
32682
M111P1E - ACCM - CTT 0000
M235P1E - ACCM - CTT 32682
G14
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
21182
M175P1E - ACCM - CAT 0000
M198P1E - ACCM - CTT 21182
G15
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
22524
M311P1E - AGCM - CAA 0000
M307P1E - AGCM - CAT 22524
G17
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
28918
M155P1E - ACCM - CAT 0000
M226P2E - AGCM - CAT 28918
G16
Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG
2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG
3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG
4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG
5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG
6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA
7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA
8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC
9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA
10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA
11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA
12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT
13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA
54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA
55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA
56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA
57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC
58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC
59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC
60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC
61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC
62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC
63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC
64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC
65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT
106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT
107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT
108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT
109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT
110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT
111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT
112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT
113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG
114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG
115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG
116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG
117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A1 Continuacioacutenhelliphelliphellip
Marcador Locus Marcador Locus Marcador Locus Marcador Locus
157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG
158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA
159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC
160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC
161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA
162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT
163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT
164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC
165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA
166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA
167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT
168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT
169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG
para Loci marcadores ligados al mapa geneacutetico
Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =
Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)
CA = Contenido de aceite de aquenios ()
Liacutenea AP NC DC NA PA CA
2 114 27 327 27 047 3492
7 115 12 355 8 018 3312
9 099 40 459 74 237 3197
11 114 87 133 5 007 3094
13 123 NA NA NA NA NA
22 105 58 365 8 010 3531
25 116 35 112 1 001 NA
27 146 10 791 49 166 3254
29 100 19 247 3 011 NA
32 070 12 260 11 025 2868
33 094 31 157 22 028 4044
42 127 19 175 3 006 NA
43 117 42 348 32 072 373
54 107 9 450 13 031 3056
59 110 22 200 6 009 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
60 122 51 NA NA NA NA
68 084 40 295 7 012 NA
69 114 46 125 1 001 NA
71 109 5 312 20 024 2285
74 077 6 408 43 053 NA
79 147 40 452 72 045 3093
83 123 19 317 2 005 NA
84 143 34 605 49 030 NA
87 109 26 252 6 004 NA
88 106 31 316 31 037 318
99 074 18 360 43 068 3676
102 137 90 293 24 036 3844
107 143 23 613 12 022 3331
109 142 51 442 25 049 3279
110 123 11 275 11 020 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
111 098 12 112 7 015 NA
112 118 21 175 7 011 NA
114 085 14 262 7 013 3307
117 092 10 354 17 043 3016
118 083 11 253 15 017 338
121 NA 1 112 5 010 NA
123 122 81 252 8 012 3399
125 104 31 301 12 024 3117
127 118 32 350 4 006 NA
130 155 13 463 84 249 2624
137 128 12 142 1 001 NA
138 091 22 135 3 005 NA
141 117 20 195 11 021 NA
145 123 18 437 27 049 2988
147 092 18 238 2 003 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
148 112 18 110 2 004 NA
169 151 48 425 16 036 2951
175 166 75 162 4 006 NA
178 075 12 142 5 009 373
180 097 13 474 32 088 3755
187 104 37 285 23 030 3534
188 133 57 354 30 053 3851
190 095 41 125 1 001 NA
192 113 20 337 59 125 378
194 100 20 359 32 084 3049
196 075 30 173 23 046 352
197 127 62 294 7 010 3225
198 093 28 486 27 047 3127
202 099 9 NA NA NA NA
203 072 17 130 1 026 3844
Cuadro A2 Continuacioacuten
Liacutenea AP NC DC NA PA CA
204 099 22 286 34 058 3829
209 126 51 325 9 017 3623
210 107 9 234 2 003 NA
211 120 65 NA 1 001 NA
216 089 6 197 5 009 NA
217 118 47 162 1 001 3911
218 108 38 265 5 011 3748
219 097 14 365 13 021 3279
226 124 8 733 17 053 3253
227 135 29 373 16 041 348
228 098 37 313 17 034 3056
229 074 22 305 19 017 3888
230 090 15 193 25 056 2598
234 100 33 119 3 004 NA
235 085 23 144 6 011 3296
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
237 080 19 343 23 035 NA
239 123 17 200 3 009 NA
246 116 5 253 12 047 3207
247 108 59 322 4 006 NA
250 082 28 248 30 055 3274
253 121 15 417 11 026 2222
255 103 23 353 35 144 3465
256 088 24 284 24 036 3417
258 096 28 361 45 076 3389
259 108 42 369 23 040 3515
260 104 8 322 47 093 3747
263 134 25 431 35 072 3474
264 097 57 299 6 008 3753
280 093 22 328 66 114 3338
281 088 10 137 1 001 NA
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
284 134 8 NA NA NA NA
286 067 19 293 24 034 2765
287 117 56 162 2 003 NA
289 114 50 383 8 023 399
291 172 44 323 17 022 2039
293 089 23 362 66 136 3264
295 098 6 NA 0 NA NA
299 106 28 268 17 032 3619
302 072 11 355 1 002 NA
303 130 21 NA 0 NA NA
309 098 10 184 38 073 431
313 123 42 162 1 001 NA
314 109 55 161 1 001 NA
316 112 NA 350 130 293 3564
317 107 18 423 7 021 3429
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
320 107 22 163 9 017 3301
321 118 31 287 11 020 3769
323 092 16 156 6 015 NA
326 070 21 279 17 031 3058
327 106 14 520 16 037 2199
328 115 30 269 8 010 2965
329 083 23 389 12 031 324
330 099 22 146 2 004 NA
333 121 12 536 11 026 354
338 085 17 259 7 013 NA
340 088 51 323 6 011 2513
342 066 10 294 4 008 NA
344 120 38 154 14 020 2158
351 093 59 357 6 011 NA
353 110 12 317 15 027 3432
Cuadro A2 Continuacioacutenhelliphelliphellip
Liacutenea AP NC DC NA PA CA
354 090 73 359 19 022 2888
355 091 22 157 1 001 NA
360 106 28 NA NA NA NA
361 127 20 439 51 121 3505
362 080 33 312 21 036 2428
363 107 21 295 6 011 3179
365 072 23 317 21 036 2016
367 117 27 454 21 046 NA
369 111 13 176 31 071 3459
370 079 17 323 2 002 NA
372 117 61 283 56 110 2835
373 117 97 180 19 026 2837
374 163 22 365 7 013 NA
Ac-8-2 121 405 134 2 001 NA
HA89 081 NA 506 93 434 4433