Tesis Doctorado en Fitomejoramiento

103
ANÁLISIS DE QTLs EN UNA POBLACIÓN DE MAPEO DE GIRASOL (Helianthus annuus L.) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECÍFICO CARLOS JAVIER LOZANO CAVAZOS TESIS Presentada como Requisito Parcial para Obtener el Grado de: DOCTOR EN CIENCIAS EN FITOMEJORAMIENTO Univ ersidad Autónoma Agraria “Antonio Narro” PROGRAMA DE GRADUADOS Buenavista, Saltillo, Coahuila, México. ABRIL DE 2008.

Transcript of Tesis Doctorado en Fitomejoramiento

Page 1: Tesis Doctorado en Fitomejoramiento

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL

(Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO

INTER-SUBESPECIacuteFICO

CARLOS JAVIER LOZANO CAVAZOS

T E S I S

Presentada como Requisito Parcial

para Obtener el Grado de

DOCTOR EN CIENCIAS

EN FITOMEJORAMIENTO

Universidad Autoacutenoma Agraria

ldquoAntonio Narrordquo

PROGRAMA DE GRADUADOS

Buenavista Saltillo Coahuila Meacutexico

ABRIL DE 2008

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO

SUBDIRECCIOacuteN DE POSTGRADO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRAS OL (Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO INTER-

SUBESPECIacuteFICO

T E S I S

Por

CARLOS JAVIER LOZANO CAVAZOS

Elaborada bajo la supervisioacuten del Comiteacute Particular de Asesoriacutea y aprobada como requisito parcial para obtener el grado de

DOCTOR EN CIENCIAS EN FITOMEJORAMIENTO

Comiteacute Particular

Asesor principal ______________________________ Dr M Humberto Reyes Valdeacutes

Asesor ______________________________

Dr Juan Manuel Martiacutenez Reyna Asesor ______________________________

Dr Octavio Martiacutenez de la Vega

Asesor ______________________________ Dr Alberto Flores Olivas

Asesor ______________________________

Dr Rosalinda Mendoza Villarreal

______________________________ Dr Jeroacutenimo Landeros Flores

Director de Postgrado

Buenavista Saltillo Coahuila Meacutexico Abril de 2008

ii

AGRADECIMIENTOS

A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto

fundamental en mi preparacioacuten profesional

Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de

trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad

Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute

como sus valiosas sugerencias en la realizacioacuten del presente documento

A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo

incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente

investigacioacuten asiacute como en la revisioacuten de tesis

Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte

de mi Comiteacute de Asesoriacutea

A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su

gran amistad

A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el

desarrollo de la presente investigacioacuten

A los Maestros del programa en Fitomejoramiento que me brindaron sus

conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional

A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento

por su gran apoyo y amistad a lo largo de mi estancia en el mismo

iii

DEDICATORIA

A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional

A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional

y comprensioacuten en todo momento de mi vida

A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo

momento una luz de amor y fortaleza

A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran

amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida

A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en

todo momento y proyecto de mi vida

iv

COMPENDIO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus

annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO

Por

CARLOS JAVIER LOZANO CAVAZOS

DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008

Dr M Humberto Reyes Valdeacutes---Asesor---

Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-

subespeciacutefica QTL

El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite

a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de

material silvestre El descubrimiento de restos de girasol domesticado de

aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen

de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al

este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de

caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos

relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de

planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten

v

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 2: Tesis Doctorado en Fitomejoramiento

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO

SUBDIRECCIOacuteN DE POSTGRADO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRAS OL (Helianthus annuus L ) DERIVADA DE UN CRUZAMIENTO INTER-

SUBESPECIacuteFICO

T E S I S

Por

CARLOS JAVIER LOZANO CAVAZOS

Elaborada bajo la supervisioacuten del Comiteacute Particular de Asesoriacutea y aprobada como requisito parcial para obtener el grado de

DOCTOR EN CIENCIAS EN FITOMEJORAMIENTO

Comiteacute Particular

Asesor principal ______________________________ Dr M Humberto Reyes Valdeacutes

Asesor ______________________________

Dr Juan Manuel Martiacutenez Reyna Asesor ______________________________

Dr Octavio Martiacutenez de la Vega

Asesor ______________________________ Dr Alberto Flores Olivas

Asesor ______________________________

Dr Rosalinda Mendoza Villarreal

______________________________ Dr Jeroacutenimo Landeros Flores

Director de Postgrado

Buenavista Saltillo Coahuila Meacutexico Abril de 2008

ii

AGRADECIMIENTOS

A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto

fundamental en mi preparacioacuten profesional

Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de

trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad

Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute

como sus valiosas sugerencias en la realizacioacuten del presente documento

A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo

incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente

investigacioacuten asiacute como en la revisioacuten de tesis

Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte

de mi Comiteacute de Asesoriacutea

A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su

gran amistad

A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el

desarrollo de la presente investigacioacuten

A los Maestros del programa en Fitomejoramiento que me brindaron sus

conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional

A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento

por su gran apoyo y amistad a lo largo de mi estancia en el mismo

iii

DEDICATORIA

A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional

A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional

y comprensioacuten en todo momento de mi vida

A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo

momento una luz de amor y fortaleza

A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran

amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida

A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en

todo momento y proyecto de mi vida

iv

COMPENDIO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus

annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO

Por

CARLOS JAVIER LOZANO CAVAZOS

DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008

Dr M Humberto Reyes Valdeacutes---Asesor---

Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-

subespeciacutefica QTL

El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite

a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de

material silvestre El descubrimiento de restos de girasol domesticado de

aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen

de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al

este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de

caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos

relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de

planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten

v

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 3: Tesis Doctorado en Fitomejoramiento

AGRADECIMIENTOS

A mi Universidad Autoacutenoma Agraria Antonio Narro por haber sido un recinto

fundamental en mi preparacioacuten profesional

Al Dr M Humberto Reyes Valdeacutes por permitirme formar parte de su equipo de

trabajo de investigacioacuten por su asesoriacutea apoyo confianza y amistad

Al Dr Juan Manuel Martiacutenez Reyna por formar parte de mi Comiteacute de Asesoriacutea asiacute

como sus valiosas sugerencias en la realizacioacuten del presente documento

A la Dra Rosalinda Mendoza Villarreal por su valiosa colaboracioacuten y gran apoyo

incondicional en la realizacioacuten de trabajos de laboratorio relacionados a la presente

investigacioacuten asiacute como en la revisioacuten de tesis

Al Dr Octavio Martiacutenez de la Vega y al Dr Alberto Flores Olivas por formar parte

de mi Comiteacute de Asesoriacutea

A Miguel Rodriacuteguez por su valiosa ayuda en la realizacioacuten del trabajo de campo y su

gran amistad

A la MC Alma Patricia Garciacutea Villanueva por su valiosa colaboracioacuten en el

desarrollo de la presente investigacioacuten

A los Maestros del programa en Fitomejoramiento que me brindaron sus

conocimientos los cuales contribuyeron en gran medida en mi formacioacuten profesional

A todos mis compantildeeros y amigos del Programa de Postgrado en Fitomejoramiento

por su gran apoyo y amistad a lo largo de mi estancia en el mismo

iii

DEDICATORIA

A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional

A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional

y comprensioacuten en todo momento de mi vida

A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo

momento una luz de amor y fortaleza

A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran

amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida

A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en

todo momento y proyecto de mi vida

iv

COMPENDIO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus

annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO

Por

CARLOS JAVIER LOZANO CAVAZOS

DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008

Dr M Humberto Reyes Valdeacutes---Asesor---

Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-

subespeciacutefica QTL

El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite

a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de

material silvestre El descubrimiento de restos de girasol domesticado de

aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen

de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al

este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de

caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos

relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de

planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten

v

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 4: Tesis Doctorado en Fitomejoramiento

DEDICATORIA

A DIOS por todas sus bendiciones y amor infinito para superar este reto profesional

A mi esposa Aurora Gabriela Daacutevila Valdeacutes por su valioso amor apoyo incondicional

y comprensioacuten en todo momento de mi vida

A mis hijos Gabriela Estefaniacutea y Carlos Alexis Lozano Daacutevila por ser en todo

momento una luz de amor y fortaleza

A mis padres Sr Alejandro Javier Lozano del Riacuteo y Elsa Cavazos Daacutevila por su gran

amor consejos sacrificios y apoyo en cada meta que me he trazado en la vida

A mi hermano Eloy Alejandro Lozano Cavazos por sus consejos amor y apoyo en

todo momento y proyecto de mi vida

iv

COMPENDIO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus

annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO

Por

CARLOS JAVIER LOZANO CAVAZOS

DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008

Dr M Humberto Reyes Valdeacutes---Asesor---

Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-

subespeciacutefica QTL

El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite

a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de

material silvestre El descubrimiento de restos de girasol domesticado de

aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen

de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al

este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de

caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos

relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de

planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten

v

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 5: Tesis Doctorado en Fitomejoramiento

COMPENDIO

ANAacuteLISIS DE QTLs EN UNA POBLACIOacuteN DE MAPEO DE GIRASOL (Helianthus

annuus L) DERIVADA DE UN CRUZAMIENTO INTER-SUBESPECIacuteFICO

Por

CARLOS JAVIER LOZANO CAVAZOS

DOCTORADO EN CIENCIAS EN FITOMEJORAMIENTO

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO ABRIL DE 2008

Dr M Humberto Reyes Valdeacutes---Asesor---

Palabras clave Girasol cultivado girasol silvestre mapa de ligamiento cruza inter-

subespeciacutefica QTL

El mejoramiento del girasol la segunda especie con mayor produccioacuten de aceite

a nivel mundial depende en gran medida de la introduccioacuten de diversidad geneacutetica de

material silvestre El descubrimiento de restos de girasol domesticado de

aproximadamente 4000 antildeos de antiguumledad en San Andreacutes Tabasco implica un origen

de domesticacioacuten maacutes antiguo y posiblemente independiente en Meacutexico con relacioacuten al

este de Norteameacuterica El objetivo del presente trabajo fue detectar posiciones de loci de

caracteres cuantitativos (QTLrsquos) y estimar sus efectos geneacuteticos especialmente aquellos

relacionados con la domesticacioacuten del girasol Se trabajoacute con ocho caracteres altura de

planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten

v

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 6: Tesis Doctorado en Fitomejoramiento

diacuteas a madurez fisioloacutegica y contenido de aceite de aquenios con el enfoque de mapeo

por intervalos en una poblacioacuten de 149 liacuteneas F23 derivada de un cruzamiento de girasol

cultivado ldquoHA89rdquo (Helianthus annuus L var macrocarpus (DC) Cockerell) y silvestre

ldquoAc-8-2rdquo (Helianthus annuus L ssp texanus Heiser) Para la evaluacioacuten de la poblacioacuten

F23 en condiciones de campo incluyendo los dos progenitores se utilizoacute el disentildeo

experimental de bloques incompletos al azar con dos repeticiones Para llevar a cabo los

anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40 tomando como base un mapa de

ligamiento geneacutetico de baja densidad basado en marcadores AFLP el cual cubre

581452 cM en 17 grupos de ligamiento y de acuerdo a los diferentes mapas geneacuteticos

publicados este representa aproximadamente el 4373 del promedio del genoma de

Helianthus annuus L Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260) Se identificoacute un

QTL significativo con amplitud genoacutemica de 0017 para peso de aquenios Asimismo se

identificaron cinco QTLrsquos sugestivos (aquellos mostrando una significancia de amplitud

de grupo de ligamiento lt 005 pero con valor de amplitud genoacutemica gt 005) a traveacutes del

mapeo por intervalos para altura de planta nuacutemero y diaacutemetro de capiacutetulos nuacutemero y

peso de aquenios Los QTLrsquos detectados (incluyendo los sugestivos) explicaron de 71 al

119 de la varianza fenotiacutepica para cinco caracteres evaluados El anaacutelisis de

marcadores individuales identificoacute cuatro loci no ligados que afectan al caraacutecter nuacutemero

de aquenios y diacuteas a madurez fisioloacutegica en forma altamente significativa (P lt0001) El

vi

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 7: Tesis Doctorado en Fitomejoramiento

contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 a

traveacutes del meacutetodo Blight y Dyer Este estudio contribuiraacute al conocimiento de la geneacutetica

de la domesticacioacuten del girasol asiacute como en la generacioacuten de marcadores para seleccioacuten

con fines de mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a

variedades de girasol elite

vii

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 8: Tesis Doctorado en Fitomejoramiento

ABSTRACT

QTL ANALYSIS IN A SUNFLOWER MAPPING POPULATION (Helianthus annuus

L) DERIVED FROM AN INTER-SUBSPECIFIC CROSS

By

CARLOS JAVIER LOZANO CAVAZOS

DOCTOR OF SCIENCE IN PLANT BREEDING

UNIVERSIDAD AUTOacuteNOMA AGRARIA ANTONIO NARRO BUENAVISTA SALTILLO COAHUILA MEacuteXICO APRIL 2008

PhD M Humberto Reyes Valdeacutes--Adviser---

Key words Cultivated sunflower wild sunflower linkage map inter-subspecific cross

QTL

The improvement of cultivated sunflower the second largest oilseed crop in the

world depends largely on the introduction of genetic diversity from wild species The

discovery of 4000 years old domesticated sunflower remains from San Andreacutes

Tabasco implies an earlier and possibly independent origin of domestication in Meacutexico

than eastern North America The purpose of the present study was to detect quantitative

trait loci (QTLrsquos) positions and its genetic effects especially those related with

sunflower domestication Eight traits were evaluated and analyzed by interval mapping

plant height branching head diameter number of achenes achene weight days to

flowering days to physiological maturity and seed oil content in a population of 149

viii

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 9: Tesis Doctorado en Fitomejoramiento

lines F23 derived from the cross of a cultivated sunflower line ldquoHA89rdquo (Helianthus

annuus L var macrocarpus (DC) Cockerell) and a wild sunflower accession ldquoAc-8-2rdquo

(Helianthus annuus L ssp texanus Heiser) The F23 population and its progenitors were

grown in field conditions by using a random incomplete block design with two

replications QTL analyses were carried out in MapQTL 40 in a low-density genetic

linkage map based on AFLP markers which covers 581452 cM on 17 linkage groups

and it represents approximately 4337 of the average Helianthus annuus L genome

according to the genetic linkage maps published up to date A genome-wide statistical

significance of 005 was used to detect QTLrsquos To determine the empirical significance

threshold values permutation tests were performed only in linkage groups showing a

LOD score gt15 Single marker-analyses using ANOVA per unlinked individual locus

for each trait evaluated was carried out to determine any possible association marker-

trait in R (versioacuten 260) One QTL with genome-wide significance of 0017 for achene

weight was identified Likewise interval mapping identified five putative QTLrsquos (those

showing a linkage group-wide statistical significance lt 005 but with a genome-wide

statistical significance gt 005) for plant height branching head diameter number of

achenes and achene weight All of QTLrsquos detected explained 71 to 119 of the

phenotypic variance for five traits evaluated Single-marker analyses identified highly

significantly (P lt0001) four unlinked loci for number of achenes and days to

physiological maturity The seed oil content in 83 sunflower lines ranged from 2016 to

4310 by the Blight and Dyer method This work will contribute to the knowledge of

the genetics of sunflower domestication and it will generate markers for selection with

breeding purposes aimed to wild trait introgression in elite sunflower cultivars

ix

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 10: Tesis Doctorado en Fitomejoramiento

IacuteNDICE DE CONTENIDO

Paacutegina

IacuteNDICE DE CUADROS ------------------------------------------------------------------ xiii

IacuteNDICE DE FIGURAS -------------------------------------------------------------------- xiv

I INTRODUCCIOacuteN ----------------------------------------------------------------------- 1

11 Objetivos ----------------------------------------------------------------------------- 4

II REVISIOacuteN DE LITERATURA ------------------------------------------------------- 5

21 Origen del girasol cultivado ------------------------------------------------------- 5

22 Taxonomiacutea --------------------------------------------------------------------------- 6

23 Distribucioacuten geograacutefica------------------------------------------------------------- 7

24 Especiacioacuten del girasol ------------------------------------------------------------- 7

25 Poblaciones de mapeo -------------------------------------------------------------- 9

26 Seleccioacuten del modelo geneacutetico ---------------------------------------------------- 11

27 Mapeo de QTLrsquos-------------------------------------------------------------------- 12

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos ------------------------------- 13

2711 Anaacutelisis de marcador individual --------------------------------------------- 13

2712 Mapeo por intervalos ---------------------------------------------------------- 15

28 LOD score --------------------------------------------------------------------------- 19

29 Significancia estadiacutestica (Prueba de hipoacutetesis) --------------------------------- 20

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula --------- 22

x

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 11: Tesis Doctorado en Fitomejoramiento

292 Pruebas de permutacioacuten---------------------------------------------------------- 23

293 Valores de P ajustados ----------------------------------------------------------- 25

294 Intervalos de confianza para QTLrsquos ------------------------------------------- 27

210 QTLrsquos muacuteltiples ------------------------------------------------------------------- 28

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples -------------------------------------- 29

21011 Regresioacuten muacuteltiple ------------------------------------------------------------ 29

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple --------------------------- 29

211 Mapeo muacuteltiple por intervalos -------------------------------------------------- 31

III MATERIALES Y MEacuteTODOS ------------------------------------------------------- 34

31 Antecedentes de investigacioacuten ---------------------------------------------------- 34

311 Formacioacuten de la poblacioacuten de mapeo ------------------------------------------ 34

312 Genotipificacioacuten ------------------------------------------------------------------ 34

313 Construccioacuten del mapa geneacutetico ------------------------------------------------ 35

314 Anaacutelisis de ligamiento ----------------------------------------------------------- 35

32 Localizacioacuten experimental -------------------------------------------------------- 37

33 Material geneacutetico ------------------------------------------------------------------- 37

34 Evaluacioacuten fenotiacutepica replicada -------------------------------------------------- 38

35 Caracteres evaluados --------------------------------------------------------------- 40

36 Disentildeo experimental y anaacutelisis estadiacutestico -------------------------------------- 46

37 Anaacutelisis geneacutetico -------------------------------------------------------------------- 47

IV RESULTADOS Y DISCUSIOacuteN ----------------------------------------------------- 48

V CONCLUSIONES ---------------------------------------------------------------------- 58

VI RESUMEN ----------------------------------------------------------------------------- 59

xi

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 12: Tesis Doctorado en Fitomejoramiento

VII LITERATURA CITADA ---------------------------- -------------------------------- 63

VIII APEacuteNDICE --------------------------------------------------------------------------- 74

xii

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 13: Tesis Doctorado en Fitomejoramiento

IacuteNDICE DE CUADROS

Cuadro Paacutegina

41 Cuadrados medios para seis caracteres relacionados a la

domesticacioacuten del girasol en una poblacioacuten segregante F2F3 --------- 50

42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos

para caracteres relacionados a la domesticacioacuten del girasol en una

poblacioacuten segregante F2F3 -------------------------------------------------------------------------- 54

43 Loci marcadores no ligados con significancia al 0001 de

probabilidad para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3 a traveacutes del meacutetodo de

marcador individual (ANOVA) -------------------------------------------- 56

xiii

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 14: Tesis Doctorado en Fitomejoramiento

IacuteNDICE DE FIGURAS

Figura Paacutegina

31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro

en Navidad N L-------------------------------------------------------------

39

32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y

Dyer --------------------------------------------------------------------------- 43

41 Perfiles de un QTL con significancia de amplitud genoacutemica para

peso de aquenios en el grupo de ligamiento 11 denominado PA-

G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica

explicada por el QTL () y (D) media estimada de la distribucioacuten

del caraacutecter peso de aquenios (g) ------------------------------------------ 52

xiv

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 15: Tesis Doctorado en Fitomejoramiento

I INTRODUCCIOacuteN

El este de Norteameacuterica es una de al menos seis regiones del mundo donde se

piensa que la agricultura se originoacute de manera independiente La principal evidencia de

esta hipoacutetesis proviene de cambios morfoloacutegicos en el registro arqueobotaacutenico

especiacuteficamente del cultivo de girasol Recientemente el girasol se ha considerado como

el uacutenico cultivo domesticado en el este de Norteameacuterica Sin embargo el descubrimiento

de hace aproximadamente 4000 antildeos de restos de girasol domesticado de San Andreacutes

Tabasco implica un origen maacutes antiguo y posiblemente independiente de domesticacioacuten

con relacioacuten al este de Norteameacuterica lo cual ha estimulado nuevas investigaciones sobre

el origen geograacutefico del girasol domesticado (Lentz et al 2001 Pope et al 2001)

Una de las herramientas maacutes poderosas en el aprovechamiento de los recursos

geneacuteticos silvestres son los mapas geneacuteticos basados en marcadores de DNA El mapeo

geneacutetico es una herramienta muy importante en el entendimiento de la organizacioacuten

genoacutemica y en la relacioacuten entre genes y fenotipo Un mapa geneacutetico es una

representacioacuten lineal o circular del orden de marcadores y distancias entre estos en un

cromosoma(s) de un organismo Uno de los objetivos en la construccioacuten de un mapa

geneacutetico es detectar y localizar los elementos geneacuteticos responsables de la variacioacuten en

un fenotipo de intereacutes El disentildeo del experimento de mapeo involucra el seleccionar el

tipo de cruza las liacuteneas progenitoras involucradas un meacutetodo para medir el fenotipo y

una estrategia para la clasificacioacuten de genotipos

Tradicionalmente las estrategias para clasificar genotipos y fenotipos han sido

evaluadas en teacuterminos de su poder para detectar un efecto geneacutetico Esto depende del

tamantildeo del efecto geneacutetico y la informacioacuten en el experimento (Sen et al 2005) El

enfoque estaacutendar para loci geneacuteticos (QTLrsquos) que contribuyen a la variacioacuten en un

caraacutecter cuantitativo hace uso de la suposicioacuten que la variacioacuten ambiental residual sigue

una distribucioacuten normal (Lander y Botstein 1989)

La identificacioacuten de LOCI DE CARACTERES CUANTITATIVOS (QTLrsquos) es

de suma importancia para proporcionar un medio de respuesta con respecto al control

geneacutetico de los caracteres cuantitativos La base para detectar QTLrsquos es asociar la

variacioacuten del fenotipo con los genotipos marcadores en una poblacioacuten segregante a

traveacutes de meacutetodos estadiacutesticos Muchos factores tales como el tamantildeo del genoma

densidad del mapa geneacutetico informatividad de marcadores y la proporcioacuten de datos

perdidos pueden afectar la distribucioacuten del estadiacutestico de prueba

Los meacutetodos de mapeo de QTLrsquos pueden ser clasificados en diferentes grupos de

acuerdo al nuacutemero de marcadores modelos geneacuteticos y enfoques analiacuteticos aplicados

Con el objetivo de detectar yo localizar QTLrsquos se pueden considerar dos meacutetodos

estadiacutesticos comunes El primer enfoque se basa en el anaacutelisis de varianza (ANOVA) o

regresioacuten lineal simple llevando a cabo pruebas estadiacutesticas basadas uacutenicamente en la

informacioacuten de los marcadores de DNA No se requiere ninguacuten mapa geneacutetico para el

2

anaacutelisis de marcador individual y los caacutelculos se basan en medias fenotiacutepicas y

varianzas dentro de cada una de las clases genotiacutepicas El segundo y maacutes utilizado se

basa en los marcadores de DNA en la estimacioacuten de la fraccioacuten de recombinacioacuten entre

estos (o la distancia geneacutetica estimada) y en el caacutelculo basado en maacutexima verosimilitud

o en un modelo de regresioacuten incluyendo marcadores muacuteltiples (dos o maacutes) como

variables independientes El mapeo de loci de caracteres cuantitativos (QTLrsquos) es un

anaacutelisis de la relacioacuten entre el genotipo en varias localizaciones genoacutemicas y el fenotipo

para un conjunto de caracteres cuantitativos en teacuterminos de nuacutemero posiciones

genoacutemicas efectos interaccioacuten y pleitropiacutea de QTLrsquos considerando la interaccioacuten

ambiental

La deteccioacuten de un QTL depende de (1) el tipo de cruza (2) el tamantildeo del efecto

del QTL (3) el nuacutemero de individuos obtenidos (4) la densidad de marcadores y (5) y

la rigidez del valor criacutetico seleccionado (ie nivel de significancia) Los principios en

los cuales se basa el mapeo de QTLrsquos son (1) disectar la herencia compleja de los

caracteres cuantitativos en factores mendelianos (2) localizar en el genoma dichos

factores y (3) estimar los efectos de los QTLrsquos El mapeo de QTLrsquos tiene como

objetivos fundamentales (1) contar con informacioacuten para clonacioacuten basada en mapas y

(2) contar con marcadores para seleccioacuten en mejoramiento geneacutetico

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell)

especie diploide anual (2n = 2x = 34) es una de las principales fuentes para extraccioacuten

de aceite de alta calidad en el mundo Se han realizado anaacutelisis de QTLrsquos para contenido

de aceite en girasol (Leoacuten et al 2003 Mokrani et al 2002) El contenido de aceite en la

3

semilla es un caraacutecter determinado predominantemente por el genotipo materno como

lo han demostrado cruzamientos reciacuteprocos utilizando liacuteneas de bajo y alto contenido de

aceite en aquenios de girasol (Pawlowski 1964 Thompson et al 1979 Haro-Ramiacuterez et

al 2007)

El presente trabajo de investigacioacuten contribuiraacute al conocimiento de la geneacutetica de

la domesticacioacuten del girasol generando marcadores para llevar a cabo la seleccioacuten

asistida por marcadores (MAS) a traveacutes del anaacutelisis de QTLrsquos De acuerdo a lo anterior

se plantearon los siguientes objetivos

11 Objetivos

1 Formacioacuten de liacuteneas endogaacutemicas recombinantes de girasol (RILrsquos)

2 Deteccioacuten localizacioacuten y estimacioacuten de efectos de QTLrsquos relacionados con la

domesticacioacuten del girasol (Helianthus annuus L var macrocarpus (DC)

Cockerell)

3 Determinar el contenido de aceite en aquenios de liacuteneas de girasol para

determinar la posible presencia de QTLrsquos que afecten esta caracteriacutestica

4

II REVISIOacuteN DE LITERATURA

21 Origen del girasol cultivado

Antes de la colonizacioacuten humana en Norte Ameacuterica Helianthus annuus estaba

restringido en forma silvestre a lo que hoy es el sureste de los Estados Unidos (Heiser

1978) En lo que respecta al girasol cultivado se han encontrado aquenios en

investigaciones arqueoloacutegicas realizadas en la parte central de Estados Unidos (Seiler y

Rieseberg 1997) Por otro lado existen nuevas evidencias que sugieren que el girasol

fue domesticado primeramente en Meacutexico aunque se postula que puede ser posible un

origen separado en los Estados Unidos (Piperno 2001 Burke et al 2002)

Esta idea del origen de domesticacioacuten muacuteltiple entra en conflicto con los

resultados del anaacutelisis de aloenzimas y DNA de cloroplastos que indica un virtual

monomorfismo en las liacuteneas cultivadas lo cual sugiere un origen simple del girasol

domesticado a partir de Helianthus annuus silvestre (Riesberg y Seiler 1990) Sin

embargo Harter et al (2004) argumenta que las variedades actuales de girasol tienen un

origen uacutenico en Estados Unidos

22 Taxonomiacutea

De acuerdo con el Departamento de Agricultura de los Estados Unidos de

Ameacuterica (USDA) 2008 el girasol se clasifica taxonoacutemicamente de la siguiente manera

Reino Plantae

Divisioacuten Magnoliophyta

Clase Magnoliopsida

Subclase Asterideae

Orden Asterales

Familia Asteraceae

Tribu Heliantheae

Geacutenero Helianthus

Especie H annuus

Los girasoles silvestres y cultivados exhiben un gran nuacutemero de diferencias

fenotiacutepicas Los girasoles silvestres presentan muacuteltiples ramificaciones hojas pequentildeas

capiacutetulos de 30 a 50 cm de diaacutemetro y una longitud de aquenios de 50 a 52 mm En

contraste las plantas de girasol cultivado no presentan ramificaciones (monoceacutefalas)

producen hojas grandes capiacutetulos de 90 a 110 cm de diaacutemetro y una longitud de

aquenios de 95 a 105 mm (Burke et al 2002)

6

23 Distribucioacuten geograacutefica

El girasol cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell) se

encuentra ampliamente adaptado a diversas aacutereas geograacuteficas desde subtropicales hasta

subaacuterticas (Jan et al 1998 Lawson et al 1998)

Las especies silvestres de girasol estaacuten adaptadas a un amplio rango de haacutebitat y

poseen una considerable variacioacuten para la mayoriacutea de las caracteriacutesticas agronoacutemicas

calidad de semilla resistencia a insectos enfermedades y tolerancia a condiciones

ambientales desfavorables (Seiler 1992) El girasol silvestre H annuus L se encuentra

ampliamente distribuido en Norteameacuterica y presenta la mayor variacioacuten morfoloacutegica y

de haacutebitat (Arias y Rieseberg 1995)

Schilling y Heiser (1981) sentildealaron que las especies silvestres de girasol H

arizonensis H ciliaris y H laciniatus se presentan en el norte de Meacutexico H

californicus en Baja California Norte H annuus en el norte de Meacutexico y H niveus en el

norte de Meacutexico y Baja California

24 Especiacioacuten del girasol

La especiacioacuten es el origen del aislamiento reproductivo y divergencia entre

poblaciones de acuerdo al concepto bioloacutegico de especie por Mayr (West-Eberhard

2005) Los evolucionistas creen que la especiacioacuten inicia usualmente con la

subdivisioacuten de especies dentro de poblaciones aisladas por una barrera geograacutefica

7

(alopatriacutea) La especiacioacuten simpaacutetrica difiere de manera significativa de la

especiacioacuten geograacutefica en que eacutesta es generada por interacciones ecoloacutegicas (Darwin

1858) Se han formulado hipoacutetesis con relacioacuten a la arquitectura geneacutetica de la

adaptacioacuten y especiacioacuten (Orr y Coyne 1992 Orr 1998 a b Noor et al 2001

Navarro y Barton 2003)

Helianthus annuus y Helianthus petiolaris comparten una amplia distribucioacuten

simpaacutetrica a lo largo del centro y oeste de los Estados Unidos Estas son faacutecilmente

distinguibles por diversos caracteres morfoloacutegicos y cromosoacutemicos y por relaciones

de ligamiento divergente causado por un miacutenimo de 20 rompimientos y fusiones

cromosoacutemicas (Burke et al 2004) En general H annuus estaacute restringido a suelos

arcillosos pesados y H petiolaris a suelos arenosos Sin embargo estos dos habitat

se encuentran a lo largo del centro y oeste de Norteameacuterica lo que ha producido

innumerables ldquomosaicosrdquo de zonas hiacutebridas Ademaacutes H annuus y H petiolaris han

originado al menos tres especies diploides estabilizadas que son fuertemente

divergentes de sus progenitores con respecto a sus habitat (dunas areniscas desiertos

y habitat de pantanos salinos) (Rosenthal et al 2002) Helianthus paradoxus pudo

haber tenido su origen en la hibridacioacuten entre H annuus y H petiolaris (Rieseberg et

al 1990 Rieseberg 1991)

Rieseberg et al (2003) describieron coacutemo la hibridacioacuten entre dos especies

de girasol generoacute genotipos los cuales se adaptaron a condiciones muy diferentes a

la de sus progenitores Esto dio lugar a tres especies hiacutebridas diploides de girasol las

cuales estaacuten aisladas ecoloacutegicamente tanto uno de otro como de sus progenitores Lo

8

anterior proporciona la evidencia de que la hibridacioacuten interespeciacutefica puede ser

adaptativa

25 Poblaciones de mapeo

Para llevar a cabo un mapeo de QTLrsquos usualmente se construye una poblacioacuten

de mapeo experimental la cual se deriva de un cruzamiento entre liacuteneas endogaacutemicas

homocigoacuteticas Se utilizan comuacutenmente cuatro tipos de poblaciones para la construccioacuten

del mapa geneacutetico y para el mapeo de QTLrsquos Poblacioacuten F2 de intercruza poblacioacuten F2

de retrocruza (BC) dobles haploides (DH) y liacuteneas endogaacutemicas recombinantes

(RILrsquos)

Poblacioacuten F2 de intercruza es una poblacioacuten de mapeo muy popular Tales

poblaciones conservan todas las combinaciones posibles de alelos parentales (Lander et

al 1987) Sin embargo cada individuo F2 posee un genotipo diferente por lo que

ninguacuten disentildeo experimental puede ser empleado para controlar de manera efectiva la

influencia ambiental Para resolver este problema se puede utilizar la evaluacioacuten de

progenies heterogeacuteneas derivadas de individuos segregantes a traveacutes de la

autofecundacioacuten (tal como la F3) sin embargo se afecta la precisioacuten de mapeo debido a

la heterogeneidad geneacutetica (Paterson et al 1990 Paterson 1997)

Poblacioacuten de F2 retrocruza se deriva del cruzamiento del hiacutebrido F1 a uno de los

dos progenitores y posee ventajas y desventajas similares a las poblaciones F2 de

intercruza Esta poblacioacuten contiene menos informacioacuten geneacutetica que la F2 de intercruza

9

ya que los efectos aditivos y algunos tipos de efectos epistaacuteticos no pueden ser

diferenciados de los efectos de dominancia

Poblacioacuten de dobles haploides (DH) es un tipo de poblacioacuten utilizada

comuacutenmente en especies que pueden estar sujetas al cultivo de anteras (usualmente de

plantas F1) seguido por duplicacioacuten cromosoacutemica Los individuos (DH) son

completamente homocigoacuteticos y pueden ser autopolinizados para producir una progenie

numerosa la cual es geneacuteticamente ideacutentica Esto permite evaluaciones de fenotipos

replicados De este modo una poblacioacuten (DH) puede llamarse tambieacuten una poblacioacuten

permanente Este meacutetodo presenta algunas desventajas (1) no es posible estimar los

efectos de dominancia y tipos de epistasis relacionados a estos (2) pueden variar las

proporciones en genotipos de polen que a su vez generan plantas (DH) por lo tanto

puede ser causado una distorsioacuten en la segregacioacuten y falso ligamiento entre algunos loci

marcadores

Poblacioacuten de liacuteneas endogaacutemicas recombinantes (RILrsquos) son poblaciones

homocigoacuteticas ldquopermanentesrdquo Estas pueden ser generadas por medios tradicionales a

traveacutes de autofecundacioacuten o apareamiento de estructuras familiares por muchas

generaciones iniciando desde F2 por el meacutetodo de descendencia de una semilla hasta

que casi todos los loci segregantes lleguen a ser homocigoacuteticos La principal desventaja

de esta poblacioacuten es similar a la de la poblacioacuten de dobles haploides datos perdidos en

efectos de dominancia y epistasis El desarrollo de la poblacioacuten (RIL) lleva un tiempo

considerable y no es posible que la totalidad de los individuos sean homocigotos en

todos los loci segregantes a traveacutes de generaciones limitadas de autofecundaciones oacute

10

apareamientos de estructuras familiares lo cual disminuye la eficiencia del mapeo de

QTLrsquos

26 Seleccioacuten del modelo geneacutetico

Un modelo geneacutetico cuantitativo relaciona el valor genotiacutepico de un individuo

con los alelos de los loci que contribuyen a la variacioacuten en una poblacioacuten en teacuterminos de

efectos aditivos de dominancia y epistaacuteticos Esta particioacuten de efectos geneacuteticos se

relaciona a la particioacuten de la varianza geneacutetica

Se han propuesto numerosos modelos para describir esta relacioacuten algunos se

basan en la particioacuten ortogonal (el efecto de un QTL es definido consecuentemente en

una poblacioacuten de referencia en equilibrio para uno dos o maacutes loci) de la varianza

geneacutetica en una poblacioacuten en equilibrio (Zeng et al 2005) La ortogonalidad asegura que

los efectos aditivos de dominancia y epistaacuteticos puedan ser estimados de manera

independiente para uno o maacutes loci en la poblacioacuten de referencia donde el modelo es

definido e interpretado

Muchas publicaciones en geneacutetica cuantitativa (Falconer y Mackay 1996)

utilizan el siguiente modelo para interpretar los efectos geneacuteticos entre genotipos AA

Aa y aa en un locus

amicro0Gdmicro1Gamicro2G minus=+=+=

11

En este modelo a es el efecto aditivo definido como la mitad de la diferencia

entre los dos valores genotiacutepicos homocigotos d es el efecto de dominancia definido

como la diferencia entre el valor genotiacutepico heterocigoto y la media del valor genotiacutepico

homocigoto y micro es una constante De esta manera los efectos geneacuteticos son definidos

solamente como una funcioacuten de los valores genotiacutepicos

El objetivo del modelo es el de proporcionar una forma para resumir e interpretar

las diferencias entre los valores genotiacutepicos y tambieacuten la variacioacuten geneacutetica observada

en una poblacioacuten bajo estudio La seleccioacuten del modelo es el componente clave del

anaacutelisis siendo la base para la estimacioacuten de los paraacutemetros geneacuteticos y la interpretacioacuten

de los datos Tradicionalmente el modelo geneacutetico aditivo se basa en el principio de

miacutenimos cuadrados con efectos geneacuteticos definidos como desviaciones de la media

poblacional (Cockerham 1954 Kempthorne 1957) En tal modelo los efectos aditivos

de dominancia y epistaacuteticos estaacuten en funcioacuten de un arreglo de valores genotiacutepicos Es de

suma importancia tomar en cuenta informacioacuten bioloacutegica y experimental como la

heredabilidad cobertura de los marcadores y tamantildeo de muestra para establecer

criterios en cuanto a seleccioacuten de modelos para el anaacutelisis de mapeo de QTLrsquos

27 Mapeo de QTLrsquos

El principal objetivo del mapeo de QTLrsquos es localizar regiones cromosoacutemicas

que afectan de manera significativa la variacioacuten de caracteres cuantitativos en una

poblacioacuten Esta localizacioacuten es importante para la identificacioacuten de genes responsables

en el entendimiento de la base geneacutetica de la variacioacuten de los caracteres cuantitativos

12

(Zeng 2005) Uno de los aspectos importantes en el mapeo de QTLrsquos es considerar el

tamantildeo de muestra El nuacutemero de individuos proporciona informacioacuten para la

estimacioacuten de medias fenotiacutepicas y varianzas

El mapeo de QTLrsquos se lleva a cabo comuacutenmente utilizando poblaciones

biparentales Por ejemplo para caracteres de plantas de baja heredabilidad se sugiere

utilizar los valores fenotiacutepicos promedio de la progenie F3 derivada de plantas

autofecundadas F2 en lugar del fenotipo F2 por siacute mismo Toda la progenie F3 derivada

de la misma planta F2 pertenece a la misma familia F23 Si el tamantildeo de cada familia F23

(el nuacutemero de progenie F3) es suficientemente grande el valor promedio de la familia

representaraacute el valor genotiacutepico de la planta F2 y por tanto puede ser incrementado el

poder en el mapeo de QTLrsquos de manera significativa (Zhang y Xu 2004) Los

procedimientos de mapeo de QTLrsquos tales como el mapeo por intervalos (IM) (Lander y

Botstein 1989) y el mapeo compuesto por intervalos (CIM) (Jansen 1993 Zeng 1993

1994) involucran pruebas de hipoacutetesis nula

271 Meacutetodos estadiacutesticos para el mapeo de QTLrsquos

2711 Anaacutelisis de marcador individual

El anaacutelisis de varianza (ANOVA) prueba de t y regresioacuten lineal simple en loci

marcadores se consideran como meacutetodos simples para el mapeo de QTLrsquos El primero

de estos fue el primer meacutetodo para la deteccioacuten de asociaciones entre marcadores

geneacuteticos y caracteres cuantitativos (Elston y Stewand 1973 Hill 1975 Mcmillan y

Robertson 1974 Soller et al 1976) Los tres enfoques mencionados no proporcionan

13

una estimacioacuten del paraacutemetro de la poblacioacuten para la localizacioacuten de un QTL o la

frecuencia de recombinacioacuten entre el marcador y el QTL (Doerge 2002) Lo anterior se

debe a que la localizacioacuten y el efecto del QTL no pueden ser estimados por separado

Los anaacutelisis de marcador individual son auacuten utilizados como un medio para

identificar marcadores que estaacuten segregando con un caraacutecter La mayor parte de estas

aplicaciones se enfocan en la deteccioacuten de marcadores individuales en lugar de regiones

genoacutemicas y representan un medio eficiente y raacutepido para examinar poblaciones

grandes para caracteres especiacuteficos tales como resistencia a enfermedades (Timmerman

et al 1996 Varshney et al 2000)

El meacutetodo de regresioacuten lineal simple se considera el maacutes sencillo en cuanto a la

asociacioacuten de marcadores con la variacioacuten de un caraacutecter cuantitativo (Soller et al

1976) Evidentemente este simple enfoque presenta algunas desventajas tales como (1)

el meacutetodo no revela si los marcadores estaacuten asociados con uno o maacutes QTLrsquos (2) no

estima las posiciones probables de los QTLrsquos (3) los efectos de los QTLrsquos son

probablemente subestimados ya que estos son confundidos con las frecuencias de

recombinacioacuten y a causa de lo anterior (4) el meacutetodo no es muy poderoso y se requiere

de muchos individuos para realizar la prueba (Lander y Botstein 1989) No obstante

este enfoque es auacuten considerado como un meacutetodo muy uacutetil para detectar las asociaciones

entre marcadores de DNA y caracteres cuantitativos

El enfoque de maacutexima verosimilitud fue introducido para mejorar el poder para

estimar los efectos de QTLrsquos por lo cual se han propuesto diversos procedimientos de

14

maacutexima verosimilitud basados en marcadores individuales (Weller et al 1988 Luo y

Kearsey 1991 Darvasi y Weller 1992) El meacutetodo de maacutexima verosimilitud en

marcadores individuales no puede determinar la posicioacuten del QTL con respecto al

marcador

La ventaja principal del anaacutelisis de varianza en un loci marcador es su

simplicidad Ademaacutes no se requiere un mapa geneacutetico para los marcadores y el meacutetodo

puede ser faacutecilmente aplicable para loci muacuteltiples Otra ventaja seriacutea la inclusioacuten de

cofactores (eg tratamientos o efectos ambientales) El anaacutelisis de varianza para el

mapeo de QTLrsquos tiene tres desventajas principales (1) no se obtienen estimaciones por

separado en cuanto a localizaciones y efectos de QTLrsquos (la localizacioacuten del QTL se

indica observando solamente cuales marcadores proporcionan las mayores diferencias

entre las medias de grupo del genotipo) El efecto aparente del QTL en un marcador seraacute

mas pequentildeo que el efecto real del QTL como resultado de la recombinacioacuten entre el

marcador y el QTL (2) se descartan individuos cuyos genotipos no aparecen en el

marcador (datos perdidos) y (3) puede haber una disminucioacuten en el poder de deteccioacuten

de QTLrsquos cuando los marcadores se encuentran ampliamente espaciados

2712 Mapeo por intervalos

Este meacutetodo fue propuesto primeramente por Lander y Botstein (1989) en el

cual se examinan los intervalos entre pares adyacentes de marcadores a lo largo de un

cromosoma y se determina el perfil de verosimilitud de una posicioacuten de un QTL en el

genoma calculando la razoacuten de verosimilitud El principio de maacutexima verosimilitud se

15

basa en (1) que puede calcularse para un conjunto de paraacutemetros (particularmente el

efecto y posicioacuten del QTL) proporcionando los datos observados en fenotipos y

genotipos marcadores (2) las estimaciones de los paraacutemetros corresponden a mayores

verosimilitudes y (3) el estadiacutestico de prueba es la razoacuten de verosimilitud (LR)

(evidencia de un QTL) comparando la maacutexima verosimilitud con la verosimilitud de un

modelo reducido donde el modelo reducido se refiere a la hipoacutetesis nula (no efecto del

QTL) La diferencia entre maacutexima verosimilitud y regresioacuten es que este uacuteltimo asume

normalidad dentro de un grupo de marcadores Si el perfil de verosimilitud supera un

valor criacutetico predefinido en una regioacuten se indica la presencia de un QTL en los liacutemites

del perfil de verosimilitud maacuteximo con la amplitud del liacutemite definido por el llamado

intervalo de soporte (Lander y Botstein 1989) Estos autores generaron una prueba de

razoacuten de verosimilitud basada en la hipoacutetesis

0b1Hy0b0H nelowast=lowast

Donde lowastb es el efecto de un QTL sugestivo expresado como una diferencia en

efectos entre el homocigoto y heterocigoto asumiendo que el QTL sugestivo fue

localizado en el punto de consideracioacuten

Haley y Knott (1992) y Martiacutenez y Curnow (1992) introdujeron un

procedimiento de mapeo de QTLrsquos basado en el meacutetodo de regresioacuten de miacutenimos

cuadrados El principio baacutesico es estimar las probabilidades de genotipos QTLrsquos en los

intervalos definidos por marcadores y de estas probabilidades calcular los coeficientes

16

de regresioacuten para ser utilizados en la estimacioacuten de la localizacioacuten y efecto de los

QTLrsquos

Esta metodologiacutea resultoacute ser una buena aproximacioacuten a los meacutetodos basados en

maacutexima verosimilitud y redujo en gran magnitud la demanda computacional del mapeo

de QTLrsquos simplificando de igual manera las modificaciones al modelo baacutesico y puede

ser ejecutado en paquetes estadiacutesticos estaacutendar Uno de las principales desventajas de

este enfoque es (1) ligamiento entre QTLrsquos (2) este meacutetodo trata con los efectos de

QTLrsquos adicionales como la variacioacuten de muestreo la cual puede causar una estimacioacuten

sesgada de los QTLrsquos disminuyendo el poder de la prueba

Haley et al (1994) ampliaron el meacutetodo para anaacutelisis de cruzamientos entre

liacuteneas exogaacutemicas Kao (2000) investigoacute de manera analiacutetica y numeacuterica a traveacutes de

simulacioacuten las diferencias entre el mapeo de QTLrsquos basado en maacutexima verosimilitud y

regresioacuten lineal Su estudio indicoacute que los meacutetodos basados en maacutexima verosimilitud

pueden ser maacutes exactos precisos y poderosos a costa de un incremento en demanda

computacional

El mapeo por intervalos (IM) tiene diversas ventajas con relacioacuten al anaacutelisis de

varianza en que este (1) proporciona una curva la cuaacutel indica la evidencia de un QTL

(2) toma en cuenta la deduccioacuten de QTLrsquos a posiciones entre marcadores (3)

proporciona mejores estimaciones en cuanto a efectos de QTLrsquos y (4) la ejecucioacuten de

este enfoque toma en cuenta datos de genotipos marcadores incompletos Sin embargo

este enfoque presenta algunas desventajas (1) este meacutetodo no es una prueba por

17

intervalos como tal (una prueba la cual pudiera distinguir si existe o no un QTL dentro

de un intervalo definido y que deba ser independiente de los efectos de QTLrsquos que se

encuentren fuera de una regioacuten definida) Auacuten cuando no exista un QTL dentro de un

intervalo el perfil de verosimilitud en un intervalo puede exceder auacuten el valor criacutetico de

manera significativa si existe un QTL en alguna regioacuten cercana en el cromosoma (2) si

existe maacutes de un QTL en un cromosoma el estadiacutestico de prueba en la posicioacuten probada

seraacute afectado por todos estos QTLrsquos y las posiciones y efectos estimados de los QTLrsquos

identificados por este meacutetodo pueden ser probablemente sesgados (Haley y Knott 1992

Martiacutenez y Curnow 1992) y (3) no es eficiente utilizar uacutenicamente dos marcadores a la

vez para llevar a cabo la prueba mientras que la informacioacuten de otros marcadores no es

utilizada Estos problemas tambieacuten se aplican a muchos otros meacutetodos de mapeo de

QTLrsquos comparables (Knapp et al 1990)

Xu (1995) sentildealoacute que aunque el meacutetodo de Hayley y Knott (1992) no demanda

mucho tiempo computacional y produce resultados similares con respecto a los

obtenidos por IM la estimacioacuten de la varianza residual es sesgada (tiende a dar valores

maacutes bajos para la prueba de razoacuten de verosimilitud) y puede ser afectado el poder de

deteccioacuten de QTLrsquos Para cada posicioacuten en el genoma es determinada la verosimilitud

para la presencia de un QTL segregante (verosimilitud bajo la hipoacutetesis alternativa H1)

De igual manera se calculan los efectos geneacuteticos del QTL y la varianza residual

El enfoque del mapeo por intervalos considera un QTL a la vez por lo tanto IM

puede sesgar la identificacioacuten y estimacioacuten de QTLrsquos cuando se localizan muacuteltiples

QTLrsquos en el mismo grupo de ligamiento (Lander y Botstein 1989 Haley y Knott 1992

18

Zeng 1994) Existen algunos problemas con eacuteste meacutetodo los cuales son (1) el

estadiacutestico de prueba en un intervalo puede ser afectado por QTLrsquos localizados en otras

regiones del cromosoma por lo que las posiciones estimadas y efectos de QTLrsquos

identificados por eacuteste meacutetodo pueden presentar un sesgo y (2) no es eficiente utilizar

solamente dos marcadores a la vez para realizar la prueba mientras que no es utilizada la

informacioacuten de otros marcadores

En el mapeo por intervalos la distribucioacuten del fenotipo es modelada como una

mezcla de dos o maacutes componentes los cuales corresponden a los dos o maacutes genotipos

diferentes en el QTL sugestivo (Lander y Botstein 1989) En casos donde la distribucioacuten

fenotiacutepica se desviacutea de la distribucioacuten normal puede resultar en falsos positivos los

cuales pueden ser obtenidos en regiones de baja informacioacuten genotiacutepica (ejemplo

marcadores ampliamente espaciados bajo nivel de polimorfismo o muchos datos

perdidos de marcadores) Rebaiuml et al (1994 1995) destacaron que para el mapeo por

intervalos la posicioacuten del QTL es un paraacutemetro que se presenta uacutenicamente bajo la

hipoacutetesis alternativa

28 LOD score

La evidencia de un QTL en una posicioacuten cromosoacutemica en particular puede

evidenciarse como un mapa de verosimilitud la prueba estadiacutestica de razoacuten de

verosimilitud es graficada con respecto a la posicioacuten mapa del QTL Lander y Botstein

(1989) introdujeron por primera vez el concepto de mapas de verosimilitud (utilizar el

LOD score como un estadiacutestico de prueba)

19

El LOD score (logaritmo de los momios es el logaritmo base 10 de la

verosimilitud de que dos loci esteacuten ligados sobre la verosimilitud de que esteacuten

segregando de manera independiente) muestra la evidencia de la presencia de un QTL en

una localizacioacuten determinada Cuando un LOD score excede el valor criacutetico

predeterminado en un grupo de ligamiento un QTL es detectado

En el mapeo por intervalos el efecto del QTL es descrito por un modelo normal

mixto La evidencia de un QTL sugestivo en una posicioacuten en el genoma es medido por la

razoacuten de verosimilitud del modelo mixto comparado a una distribucioacuten normal (LOD

score) (Feenstra y Skovgaard 2004) Este enfoque puede causar ocasionalmente LOD

score aparentes o falsos en regiones de baja informacioacuten genotiacutepica (eg marcadores

ampliamente espaciados) especialmente si la distribucioacuten fenotiacutepica se desviacutea de

manera marcada de la distribucioacuten normal

29 Significancia estadiacutestica (Prueba de hipoacutetesis)

Sin tomar en cuenta el meacutetodo utilizado para estimar y localizar QTLrsquos

individuales o muacuteltiples una vez que son calculados los estadiacutesticos de prueba se

determina la verosimilitud del evento La base estadiacutestica de estas comparaciones

depende de los supuestos del modelo el maacutes comuacuten de los cuales requiere de los valores

del caraacutecter cuantitativo para ser distribuidos de manera normal Sin embargo esta

distribucioacuten no es normal en realidad y necesita ser considerado como una mezcla de

distribuciones normales (Doerge et al 1997)

20

Un enfoque para obtener la distribucioacuten del estadiacutestico de prueba es el de utilizar

un meacutetodo de simulacioacuten para producir los datos (Lander y Botstein 1989 Jansen

1993 Rebaiuml et al 1994) Los estadiacutesticos de prueba en conjunto muestran el

comportamiento de la prueba y por lo tanto representan la distribucioacuten estadiacutestica del

estadiacutestico de prueba en particular A partir de esta distribucioacuten se elige el nivel de

significancia estadiacutestico o valor criacutetico sobre el cual los resultados son considerados

significativos de manera estadiacutestica (vaacutelidos) Los meacutetodos de remuestreo no

parameacutetricos han proporcionado una alternativa uacutetil para valores criacuteticos basados en

simulacioacuten (Lander y Kruglyak 1995)

La prueba de permutaciones (Fisher 1935 Churchill y Doerge 1994) y el

meacutetodo bootstrap (Efron y Tibshirani 1993) han sido aplicados como un medio de

aleatorizacioacuten de los datos fenotiacutepicos (caraacutecter) con el objetivo de evaluar cualquier

estadiacutestico de prueba bajo la hipoacutetesis nula

En ambos meacutetodos de remuestreo las asignaciones de los genotipos marcadores

permanecen en su estado original por lo tanto no ocurre ninguacuten cambio en el mapa

geneacutetico Una implicacioacuten a esto uacuteltimo es que se conserva toda la informacioacuten

genotiacutepica y de la poblacioacuten (eg distorsioacuten de la segregacioacuten datos perdidos y

fracciones de recombinacioacuten) (Doerge 2002) Situaciones en las cuales los efectos

bioloacutegicos y estadiacutesticos son minimizados (eg distorsioacuten en la segregacioacuten variacioacuten

ambiental tamantildeo pequentildeo de muestra y datos incompletos) los valores criacuteticos basados

en meacutetodos de remuestreo o en teacuterminos teoacuterico son generalmente los mismos (Van

Ooijen 1999 Doerge y Rebai 1996)

21

291 Comportamiento del estadiacutestico de prueba bajo la hipoacutetesis nula

Por lo general se puede tolerar un margen de error en la deteccioacuten de los QTLrsquos

eg 5 de los casos Este problema puede ser explicado a traveacutes de un ajuste de prueba

muacuteltiple tales como Bonferroni Scheffe oacute Tukey el cual corrige el nivel de

significancia de acuerdo a la cantidad de pruebas estadiacutesticas independientes que sean

realizadas (Doerge 2002) Lander y Botstein (1989) analizaron el tema del valor criacutetico

del estadiacutestico de prueba (utilizando el LOD score) para el mapeo por intervalos Sin

embargo es diferente el valor criacutetico del estadiacutestico de prueba para el mapeo compuesto

por intervalos

Para lograr un nivel de significancia total α para la prueba con M intervalos

puede utilizarse un nivel simboacutelico de significancia αM para la prueba en cada

intervalo Sin embargo no es clara la distribucioacuten de la maacutexima razoacuten de verosimilitud

sobre un intervalo bajo la hipoacutetesis nula Esta distribucioacuten depende en gran medida del

tamantildeo de muestra el nuacutemero de marcadores ajustados en el modelo y el tamantildeo

geneacutetico de cada intervalo

Muchos factores como el tamantildeo de muestra tamantildeo del genoma la densidad

del mapa geneacutetico informatividad de los marcadores y la proporcioacuten de datos perdidos

pueden afectar la distribucioacuten del estadiacutestico de prueba bajo la hipoacutetesis nula (Lander y

Botstein 1989 Zeng 1994 Churchill y Doerge 1994 Kao 1995)

22

Se le denomina valor de P a la probabilidad de obtener un LOD score mayor con

respecto al observado LOD scores mayores resultan en valores pequentildeos de P los

cuales a su vez indican que la hipoacutetesis nula es falsa (existencia de un QTL) Un LOD

score de 3 indica que la verosimilitud de obtener los datos observados es 1000 veces

mas probable que si no existiera ninguacuten QTL dado que existe un QTL en una posicioacuten

especiacutefica

Se han realizado diversos esfuerzos en cuanto a la estimacioacuten del valor criacutetico el

cual corresponde a un valor de P del 5 La distribucioacuten nula del LOD score maacuteximo

depende de (l) el tipo de cruza (2) el tamantildeo del genoma (3) el nuacutemero y

espaciamiento entre marcadores geneacuteticos (4) la cantidad y patroacuten en cuanto a la

informacioacuten de genotipos perdidos y (5) la distribucioacuten real de los fenotipos

292 Pruebas de permutacioacuten

Para evitar caacutelculos asimeacutetricos aproximados de manera asintoacutetica se puede

utilizar la prueba de permutaciones (Churchill y Doerge 1994) La idea es replicar el

anaacutelisis original una gran cantidad de veces en grupos de datos generados a traveacutes de un

remuestreo aleatorio de los datos originales del caraacutecter mientras permanecen intactos

los datos de marcadores

La evaluacioacuten de la significancia estadiacutestica de amplitud genoacutemica es un

problema importante y difiacutecil en el anaacutelisis de ligamiento multipunto La permutacioacuten es

ampliamente utilizada para determinar la significancia de amplitud genoacutemica (Zou et al

23

2004) Churchill y Doerge (1994) sugirieron originalmente al menos 1000

permutaciones para estimar los valores criacuteticos lo cual corresponde a un valor de P

ajustado de 005 sin embargo sentildealan que se pueden requerir hasta 10000

permutaciones para obtener estimaciones estables de un valor criacutetico correspondiente a

un valor de P ajustado de 001 La prueba de permutaciones tiene la ventaja que no hace

suposiciones en la distribucioacuten del fenotipo Sin embargo los valores criacuteticos dependen

de los datos observados de modo que estos deben ser analizados por el meacutetodo de

Monte Carlo para cada estudio

El algoritmo para generar un valor criacutetico basado en permutaciones es el

siguiente (a) En el experimento los individuos son designados con nuacutemeros uacutenicos

(1hellip n) (b) los datos fenotiacutepicos son mezclados tomando una permutacioacuten al azar de

los iacutendices 1hellip n e igualando el i-eacutesimo valor del caraacutecter fenotiacutepico a el individuo con

el iacutendice dado por el i-eacutesimo elemento de los iacutendices permutados Este vector permutado

de caracteres es igualado con la informacioacuten original de los genotipos (no permutado)

para todos los individuos (c) se realiza un anaacutelisis del genoma para efectos de QTLrsquos en

el conjunto de datos permutados resultantes registrando el mayor estadiacutestico de prueba

(LOD score) (d) los pasos a y b se repiten un total de N veces (N es frecuentemente

1000) produciendo N estadiacutesticos de prueba maacuteximos uno de cada anaacutelisis genoacutemico

(e) los estadiacutesticos de prueba N maacuteximos son ordenados en orden ascendente (menor a

mayor) y (f) el percentil ( )α1100 minus de los valores N ordenados es el valor criacutetico

estimado del experimento para controlar el error tipo I a nivel α Con 005α = y

1000N = el valor 950 de los estadiacutesticos de prueba maacuteximos ordenados seraacute el valor

24

criacutetico estimado Se puede observar que auacuten cuando 1000N = es suficiente para obtener

un valor criacutetico para 005α = se recomienda el conjunto de datos mezclados en el orden

de 10000N = con 001α= para obtener estimaciones estables (Churchill y Doerge

1994)

293 Valores de P ajustados

Los valores de P ajustados proporcionan significancia de amplitud genoacutemica de

LOD score individuales y estos se obtienen a traveacutes de una modificacioacuten del algoritmo

para generar valores criacuteticos basados en permutaciones El LOD score actuacutea como un

perfil de verosimilitud revelando en cada punto de anaacutelisis el soporte relativo por la

presencia de un QTL en esa posicioacuten (Lystig 2003)

Dos de los enfoques maacutes comunes para estimar los valores criacuteticos son (1) el

meacutetodo analiacutetico (Lander y Botstein 1989 Lander y Kruglyak 1995) y (2) el meacutetodo

empiacuterico basado en pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996 Nettleton y Doerge 2000) Los valores criacuteticos se calculan para

controlar la tasa de falsos positivos a nivel α para el anaacutelisis completo del genoma Un

valor criacutetico no proporciona un nivel preciso de significancia de amplitud genoacutemica para

los valores LOD score individuales Es importante conocer la significancia de amplitud

genoacutemica o valores de P ajustados de cada uno de los puntos de anaacutelisis representados

en la curva LOD score (Westfall y Young 1993)

25

La interpretacioacuten de un valor de P ajustado para un LOD score en particular

dentro de un anaacutelisis genoacutemico se refiere a la probabilidad de observar el maacuteximo LOD

score de un anaacutelisis genoacutemico que fue al menos tan grande como el LOD score en

cuestioacuten dado que la hipoacutetesis nula es verdadera (Lystig 2003)

Lo anterior difiere de un valor de P estaacutendar no ajustado el cual considera

solamente la significancia marginal del LOD score para un punto de anaacutelisis en

particular sin explicar otros LOD score obtenidos para el anaacutelisis completo del genoma

Ademaacutes tal algoritmo modificado tambieacuten proporciona un caacutelculo aproximado Monte

Carlo a la distribucioacuten nula del LOD score maacuteximo proveniente del anaacutelisis completo

del genoma Este algoritmo es apropiado cuando la hipoacutetesis nula plantea que no hay

presencia de alguacuten QTL en una posicioacuten en particular del genoma de manera que la

informacioacuten fenotiacutepica y genotiacutepica es mutuamente independiente

Para calcular los valores de P ajustados la uacutenica parte del algoritmo descrito por

(Lystig 2003) que debe ser modificado es el inciso (f) en lugar de extraer un valor

simple de los valores N ordenados para formar un valor criacutetico se calcula simplemente

(para cada LOD score estadiacutestico observado ldquoxrdquo del anaacutelisis original del genoma) la

proporcioacuten de los estadiacutesticos de prueba N maacuteximos que son mayores o iguales a ldquoxrdquo Se

puede facilitar la determinacioacuten del nuacutemero de estadiacutesticos maacuteximos mayores que un

LOD score estadiacutestico observado ya que los estadiacutesticos de prueba N maacuteximos fueron

ordenados secuencialmente en el inciso (e)

26

Para obtener valores de P ajustados es necesario incorporar una modificacioacuten al

algoritmo descrito por (Lystig 2003) como sigue para cada LOD score ldquoxrdquo del anaacutelisis

genoacutemico de los datos originales no permutados se calcula el nuacutemero de estadiacutesticos de

prueba maacuteximos que son mayores o iguales a ldquoxrdquo y dividir por N

Los valores ajustados de P calculados a traveacutes de la modificacioacuten del algoritmo

pueden utilizar la distribucioacuten total de los estadiacutesticos de prueba maacuteximos a partir de un

conjunto N de anaacutelisis genoacutemico mientras un valor criacutetico basado en permutaciones

utiliza solamente el percentil ( )α1100 minus de esos estadiacutesticos Es importante notar que

ademaacutes de un valor criacutetico 005α= puede calcularse cualquier otro cuantil de intereacutes a

partir del conjunto de LOD score maacuteximos N Los cuantiles de la distribucioacuten nula

aproximada del LOD score maacuteximo pueden ser utilizados para determinar valores

criacuteticos muacuteltiples los cuales en tal caso corresponden a valores ajustados de P (Lystig

2003) En resumen los valores ajustados de P proporcionan niveles precisos de

significancia para todos los puntos de anaacutelisis en el genoma Estos valores representan

un suplemento valioso para las curvas LOD score asiacute como un recurso para modelos

geneacuteticos de caracteres cuantitativos

294 Intervalos de confianza para QTLrsquos

Un intervalo de confianza puede ser utilizado para identificar una regioacuten

cromosoacutemica en la cual se ejecuta una buacutesqueda para localizar de manera exacta un

QTL Entre los diversos meacutetodos que existen para construir un intervalo de confianza

27

para la localizacioacuten de QTLrsquos uno de los maacutes importantes es el meacutetodo bootstrap

descrito por (Visscher et al 1996) el cual es un procedimiento de remuestreo y es

utilizado para determinar un intervalo de confianza empiacuterico para la localizacioacuten del

QTL asumiendo que existe el efecto del QTL

210 QTLrsquos muacuteltiples

Los enfoques estadiacutesticos para localizar loci de caracteres cuantitativos muacuteltiples

son maacutes poderosos que los enfoques que consideran QTLrsquos individuales ya que estos

pueden diferenciar de manera potencial entre QTLrsquos ligados yo interaccioacuten entre estos

Cuando los alelos de dos o maacutes QTLrsquos interactuacutean (epistasis) se altera en gran

medida el caraacutecter cuantitativo de una manera en la cual es difiacutecil predecir Uno de los

casos maacutes extremos y maacutes simples es la peacuterdida completa en la expresioacuten del caraacutecter en

la presencia de una combinacioacuten en particular de alelos en QTLrsquos muacuteltiples

Uno de los retos fundamentales en la buacutesqueda de QTLrsquos muacuteltiples es (1)

considerar cada posicioacuten en el genoma de manera simultaacutenea para la localizacioacuten de un

QTL potencial que pudiera actuar de manera independiente (2) estar ligado o interactuar

epistaacuteticamente con otro QTL (Doerge 2002)

La aplicacioacuten de algoritmos geneacuteticos (ie procedimientos de optimizacioacuten

numeacutericos basados en principios evolutivos tales como mutacioacuten delecioacuten y seleccioacuten)

(Carlborg et al 2000 Foster 2001) permite un muestreo de los modelos de QTLrsquos a

28

traveacutes de nuacutemeros desiguales de QTLrsquos y puede ser utilizado en conjuncioacuten con

cualquier metodologiacutea de mapeo de QTLrsquos que es implementada para una buacutesqueda

multidimensional genoacutemica

Existen diversas ventajas utilizando meacutetodos que modelan QTLrsquos muacuteltiples de

manera simultaacutenea (1) se puede controlar la presencia de un QTL reducir la variacioacuten

residual y obtener mayor poder para detectar QTLrsquos adicionales (2) se pueden separar

QTLrsquos ligados y (3) se puede identificar interacciones entre QTLrsquos (epistasis)

(Shrimpton y Robertson 1988 Frankel y Schork 1996 Mackay 1996)

2101 Meacutetodos de mapeo de QTLrsquos muacuteltiples

21011 Regresioacuten muacuteltiple

Este meacutetodo comparte muchas de las desventajas del anaacutelisis de varianza en loci

marcadores y lo maacutes importante este requiere de datos completos de genotipos

marcadores Este meacutetodo tiene la ventaja potencial de controlar la variabilidad fenotiacutepica

debido a QTLrsquos muacuteltiples sin embargo posee la desventaja de que el eacutexito del control

depende de colocar fortuitamente los marcadores junto a un QTL verdadero (Zeng

1993)

21012 Propiedades del anaacutelisis de regresioacuten muacuteltiple

(a) En el anaacutelisis de regresioacuten muacuteltiple asumiendo aditividad de los efectos de

QTLrsquos entre loci (ie ignorando epistasis) el coeficiente de regresioacuten parcial esperado

29

del caraacutecter en un marcador depende solamente de aquellos QTLrsquos localizados en el

intervalo definido por los dos marcadores flanqueantes y no es afectado por los efectos

de QTLrsquos localizados en otros intervalos Esta propiedad indica esencialmente que

puede ser construida una prueba condicional (intervalo) basaacutendose en el coeficiente de

regresioacuten parcial y esta a la vez probariacutea el efecto del ligamiento de solamente aquellos

QTLrsquos que estaacuten localizados dentro del intervalo definido (Zeng 1993)

(b) Dependiendo de los marcadores no ligados en el anaacutelisis de regresioacuten

muacuteltiple se reduciraacute la varianza de muestreo del estadiacutestico de prueba controlando

alguna variacioacuten geneacutetica residual y por tanto se incrementaraacute el poder del mapeo de

QTLrsquos Esto significa que incluso marcadores no ligados contienen informacioacuten uacutetil la

cual puede ser utilizada para incrementar el poder estadiacutestico de la prueba y la eficiencia

del mapeo geneacutetico (Zeng 1993)

(c) Dependiendo de los marcadores ligados en el anaacutelisis de regresioacuten muacuteltiple se

reduciraacute la oportunidad de interferencia de posibles QTLrsquos ligados muacuteltiples en la

prueba de hipoacutetesis y en la estimacioacuten de paraacutemetros pero con un posible incremento en

la varianza de muestreo Un intervalo de prueba puede traer consigo una peacuterdida en el

poder estadiacutestico de la prueba ya que esta es una prueba condicional (Zeng 1993)

(d) Generalmente dos coeficientes de regresioacuten parcial de la muestra para el

valor del caraacutecter en dos marcadores en un anaacutelisis de regresioacuten muacuteltiple no estaacuten

correlacionados a menos que los dos marcadores generalmente sean marcadores

30

adyacentes Esto se relaciona a la correlacioacuten entre dos estadiacutesticos de prueba en dos

intervalos para un intervalo de prueba

Se ha mostrado que para un intervalo de prueba un estadiacutestico de prueba en un

intervalo generalmente no estaacute correlacionado de manera asintoacutetica al estadiacutestico de

prueba en otro intervalo a menos que dos intervalos sean adyacentes entre siacute (Zeng

1993) Incluso cuando los dos intervalos sean adyacentes la correlacioacuten entre dos

estadiacutesticos de prueba en dos intervalos es usualmente muy pequentildea Esta propiedad estaacute

relacionada con la determinacioacuten de un valor criacutetico apropiado de un estadiacutestico de

prueba bajo una hipoacutetesis nula para una prueba global que cubre un genoma completo

(Zeng 1993)

211 Mapeo muacuteltiple por intervalos

Este enfoque proporciona un medio detallado para estimar los paraacutemetros

geneacuteticos por medio de la diferencia entre poblaciones progenitoras y entre poblaciones

segregantes Esto proporciona una estimacioacuten de efectos aditivos de dominancia y

epistaacuteticos de QTLrsquos y la particioacuten de la varianza explicada por el QTL (Zeng et al

1999)

El meacutetodo puede tambieacuten proporcionar una estimacioacuten eficiente de los valores

genotiacutepicos para individuos basado en datos de marcadores los cuales pueden ser

utilizados para la seleccioacuten asistida por marcadores El modelo MIM se basa en el

modelo de Cockerham (1954) para interpretar los paraacutemetros geneacuteticos y en el meacutetodo

31

de maacutexima verosimilitud para estimar los paraacutemetros geneacuteticos Con eacuteste meacutetodo se

puede mejorar la precisioacuten y poder del mapeo de QTL

De igual manera la epistasis entre QTLrsquos los valores genotiacutepicos de individuos

y las heredabilidades de caracteres cuantitativos pueden ser estimados y analizados maacutes

faacutecilmente La idea de este meacutetodo es ajustar los efectos de QTLrsquos sugestivos muacuteltiples

con los efectos epistaacuteticos asociados de manera directa en un modelo para facilitar la

buacutesqueda prueba y estimacioacuten de posiciones efectos e interacciones de QTLrsquos muacuteltiples

y sus contribuciones a la varianza geneacutetica

MIM nos permite (1) deducir la ubicacioacuten de QTLrsquos a posiciones entre

marcadores (2) considera datos genotiacutepicos perdidos y (3) permite interacciones entre

QTLrsquos Existen otros enfoques incluyendo el meacutetodo Bayesiano (Hoeschele y

VanRaden 1993 Satagopan et al 1996 Uimari y Hoeschele 1997 Sillanpaumlauml y Arjas

1999) y el uso del algoritmo geneacutetico (Carlborg et al 2000) MIM consiste de cuatro

componentes

a Un procedimiento de evaluacioacuten disentildeado para analizar la verosimilitud de los datos

dando un modelo geneacutetico (nuacutemero posiciones y teacuterminos epistaacuteticos de QTLrsquos)

b Una estrategia de buacutesqueda optimizada para seleccionar el mejor modelo geneacutetico

c Un procedimiento de estimacioacuten para todos los paraacutemetros geneacuteticos de los caracteres

cuantitativos (nuacutemero posiciones efectos y epistasis de QTLrsquos varianzas geneacuteticas y

covarianzas explicadas por los efectos de los QTLrsquos) dado el modelo geneacutetico

seleccionado

32

d Un procedimiento de prediccioacuten para estimar o predecir los valores genotiacutepicos de

individuos y su descendencia basado en el modelo geneacutetico seleccionado y en los

valores de los paraacutemetros geneacuteticos estimados para la seleccioacuten asistida por

marcadores

33

III MATERIALES Y MEacuteTODOS

31 Antecedentes de investigacioacuten

311 Formacioacuten de la poblacioacuten de mapeo

La construccioacuten de la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo se conformoacute por

149 liacuteneas derivadas de F2 en F3 provenientes de un cruzamiento entre la liacutenea cultivada

HA89 (Helianthus annuus L var macrocarpus (DC) Cockerell) y una planta silvestre

identificada como Ac-8-2 (H annuus L ssp texanus Heiser) procedente de una

poblacioacuten colectada en Saltillo Coahuila La poblacioacuten de mapeo se desarrolloacute en la

Universidad Autoacutenoma Agraria ldquoAntonio Narrordquo en el periodo de 1996 al 2002 Las

plantas F1 obtenidas se cruzaron fraternalmente y las plantas F2 fueron autofecundadas

para formar las 149 liacuteneas El criterio de seleccioacuten de estas liacuteneas fue que contaran con

una produccioacuten de 50 aquenios como miacutenimo (Rodriacuteguez de la Paz 2005)

312 Genotipificacioacuten

La teacutecnica molecular se llevoacute a cabo a traveacutes del sistema AFLP (polimorfismo en

longitud de fragmentos amplificados) propuesto por Vos et al (1995) y se empleoacute el

protocolo ldquoIRDye Flourecent AFLPreg Kit for Large Plant Genome Analysis LI-COR

(Biosciences)rdquo en el Laboratorio de Geneacutetica del CINVESTAV IPN (Centro de

investigacioacuten y de Estudios Avanzados) en Irapuato Gto Meacutexico (Castillo 2005)

313 Construccioacuten del mapa geneacutetico

Para la construccioacuten del mapa de ligamiento se empleoacute el software JoinMapreg

versioacuten 30 (Van y Voorrips 2001) desarrollado para poblaciones experimentales en

especies diploides el cual maneja poblaciones con padres no homocigotos Se realizoacute el

registro de polimorfismos codificando con el nuacutemero 1 la presencia y 0 la ausencia de

la banda Se realizaron pruebas de X 2 cuadrada para determinar la distorsioacuten en la

segregacioacuten para cada locus con el uso del sistema software Matemaacutetica 50 (Wolfram

2003) Se formaron grupos de ligamiento con un LOD de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 (Castillo 2005) La conversioacuten de frecuencias de

recombinacioacuten a distancia mapa se realizoacute a traveacutes de la funcioacuten de mapeo de Kosambi

(1944)

314 Anaacutelisis de ligamiento

De las 11 combinaciones de AFLP con iniciadores selectivos en 145 liacuteneas se

obtuvieron 295 bandas polimoacuterficas De todas las bandas polimoacuterficas encontradas 194

procedieron del progenitor HA89 y 101 del progenitor Ac-8-2 con un promedio de 268

polimorfismos por combinacioacuten con un peso molecular entre 64 y 506 bases (Castillo

2005) Dicho promedio de bandas polimoacuterficas es superior a los 215 con un peso

molecular entre 200 y 1000 bases reportado por Langar et al (2003) en girasol

35

En cuanto a la tasa de distorsioacuten en la segregacioacuten en las bandas polimoacuterficas

obtenidas a partir de las 11 combinaciones de iniciadores selectivos utilizados se

eliminaron los 87 polimorfismos con mayor distorsioacuten bajo el criterio de un valor de P

para la X 2 cuadrada menor o igual a 0002 lo cual representoacute un 294 de

polimorfismos eliminados Lo anterior resultoacute en un total de 208 bandas polimoacuterficas

para realizar el anaacutelisis de ligamiento De estas 144 bandas (6923) segregaron 31 y

64 bandas (3076) lo hicieron 11 Por otra parte se obtuvo una media de frecuencia de

bandas de 065 por lo que se descartaron todas aquellas liacuteneas con una frecuencia lt045

lo cual resultoacute en la eliminacioacuten de 12 liacuteneas Por lo anterior se consideraron solamente

133 liacuteneas para el anaacutelisis de mapeo (Castillo 2005)

En el Cuadro A1 se presentan los 208 loci utilizados para obtener el mapa de

ligamiento geneacutetico de los cuales el 1923 (40 loci) se agruparon en 17 grupos de

ligamiento (Figura A1) con un LOD score miacutenimo de 30 y una frecuencia de

recombinacioacuten maacutexima de 045 lo cuaacutel resultoacute en un mapa de baja densidad

El poder estadiacutestico del experimento no fue suficiente para detectar ligamiento

entre un nuacutemero considerable de loci Sin embargo los marcadores no ligados tambieacuten

son uacutetiles para detectar QTLrsquos El nuacutemero de loci mapeados por cada grupo de

ligamiento varioacute de 2 a 6 con tamantildeos de grupo de 21 a 65 cM De esta manera se

obtuvo una distancia promedio entre loci de 1465 cM Los loci mapeados tuvieron un

origen de banda del 20 para Ac-8-2 y 80 para HA89 (Castillo 2005) Esto sugiere

que una porcioacuten substancial del genoma del progenitor macho podriacutea estar sub-

representado en el mapa geneacutetico En este contexto Langar et al (2003) encontraron

36

una sub-representacioacuten del genoma del progenitor masculino (LR4) de girasol cultivado

debido probablemente a la alta heterocigosidad del progenitor silvestre por lo que

muchas bandas procedentes de loci heterocigotos con distorsioacuten en la segregacioacuten en

esta investigacioacuten se eliminaron del anaacutelisis estadiacutestico

El mapa obtenido cubre 581452 cM lo cual representa aproximadamente el

4337 del promedio del genoma de Helianthus annuus L de acuerdo a los diferentes

mapas de ligamiento geneacutetico de girasol cultivado publicados (Berry et al 1995

Gentzbittel et al 1995 Jan et al 1998 Seung-Chul y Rieseberg 1999 Tang et al 2002

Langar et al 2003 Yu et al 2003)

32 Localizacioacuten experimental

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante se realizaron en el Campo Agriacutecola Experimental de la Universidad

Autoacutenoma Agraria Antonio Narro en Navidad N L localizado a 27ordm 04rsquo N y 100ordm 56rsquo

O con altitud de 1895 m

33 Material geneacutetico

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

37

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2)

34 Evaluacioacuten fenotiacutepica replicada

Se realizoacute la siembra de las liacuteneas F2F3 para la produccioacuten de plaacutentulas en

primavera de 2004 en vasos de polipropileno utilizando ocho semillas por cada liacutenea en

condiciones de vivero El transplante en campo se realizoacute el diacutea 12 de mayo de 2004 La

distancia entre plantas surcos y grupos fue de 070 080 y 160 m respectivamente

(Figura 31)

Se utilizoacute la dosis de fertilizacioacuten 60-40-00 para lo cual se aplicoacute urea y

superfosfato triple como fuente de nitroacutegeno y foacutesforo respectivamente La frecuencia

de riegos varioacute dependiendo de las condiciones de humedad del suelo a lo largo del ciclo

del cultivo

Dada la limitada cantidad de semilla se establecieron cuatro plantas por liacutenea por

parcela en cada una de las dos repeticiones de las cuales se consideraron solamente dos

plantas para la evaluacioacuten de todos los caracteres ya que presentaron competencia

completa a lo largo del ciclo del cultivo

38

Figura 31 Liacuteneas F23 (fenotipos replicados) evaluadas en el Campo Agriacutecola Experimental de la Universidad Autoacutenoma Agraria

Antonio Narro en Navidad N L

Cada parcela estuvo bordeada por plantas de la variedad ldquoPrimaverardquo a traveacutes de

una siembra directa a una distancia de 070 m de cada planta orillera por parcela Lo

anterior se realizoacute dos semanas despueacutes del transplante de las liacuteneas F2F3 Se establecioacute

un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro plantas por parcela y

una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas recombinantes de girasol

(RILrsquos) para lo cual se realizaron tres a cuatro autofecundaciones en botones florales de

cada planta correspondiente a una liacutenea adicional utilizando soacutelo un aplicador de franela

por planta para evitar cualquier contaminacioacuten por polen

35 Caracteres evaluados

En la etapa de floracioacuten se cubrieron botones florales con bolsas de papel previa

identificacioacuten de cada liacutenea F2F3 en las dos plantas consideradas para la evaluacioacuten de

todos los caracteres Se realizaron tres a cuatro autofecundaciones en botones florales

para cada planta evaluada por liacutenea utilizando soacutelo un aplicador de franela por planta

para evitar cualquier contaminacioacuten por polen

Los caracteres evaluados en condiciones de campo fueron diacuteas a floracioacuten diacuteas a

madurez fisioloacutegica altura de planta nuacutemero y diaacutemetro de capiacutetulos Para la evaluacioacuten

de este uacuteltimo se llevoacute a cabo un muestreo aleatorio de cinco capiacutetulos por planta los

cuales fueron autofecundados para la produccioacuten de aquenios El diaacutemetro de capiacutetulos

se basoacute en dos mediciones perpendiculares considerando solamente el promedio de

estas mismas en cada repeticioacuten para los anaacutelisis estadiacutesticos En las 133 liacuteneas F23

(fenotipos replicados) asiacute como los progenitores no se observaron diferencias en cuanto

40

a diacuteas a floracioacuten y diacuteas a madurez fisioloacutegica por lo cual se consideroacute tomar un solo

dato cuantitativo para cada liacutenea por lo que no se realizaron los anaacutelisis de varianza

respectivos a estos caracteres El peso nuacutemero y contenido de aceite de aquenios se

evaluaron en condiciones de laboratorio tomando como referencia los capiacutetulos

muestreados para la evaluacioacuten del diaacutemetro de capiacutetulos

En el Cuadro A2 se muestran las medias solamente para seis caracteres

evaluados (altura de planta nuacutemero de capiacutetulos diaacutemetro de capiacutetulos nuacutemero de

aquenios peso de aquenios y contenido de aceite de aquenios)

La altura de planta se evaluoacute cuando se presentoacute el 50 de apertura floral para

cada liacutenea realizando mediciones desde la base hasta el punto de crecimiento de cada

planta utilizando una cinta meacutetrica Los capiacutetulos se contaron cuando las plantas

presentaron madurez fisioloacutegica Desde la siembra hasta que el 50 de los capiacutetulos de

cada planta por liacutenea evaluada alcanzoacute la etapa R55 (50 de apertura de flores

liguladas) se determinaron los diacuteas a floracioacuten mientras que los diacuteas a madurez

fisioloacutegica se tomaron cuando las braacutecteas y una gran proporcioacuten del capiacutetulo se

tornaron de color amarillo y cafeacute (etapa R9) (Schneiter y Miller 1981) Los aquenios

fueron cosechados contabilizados y pesados de cada capiacutetulo muestreado para evaluar el

nuacutemero y peso de aquenios

Para determinar el contenido de aceite de aquenios se utilizoacute el meacutetodo para

extraccioacuten de liacutepidos propuesto por Bligh y Dyer (1959) el cual requiere muy poca

41

cantidad de muestra (05 g) permite una excelente estimacioacuten de porcentaje de liacutepidos y

es raacutepido (Figura 32) El protocolo de este meacutetodo es el siguiente

a) Pesar 05 g de muestra previamente molida + 40 ml de la mezcla de solventes (70

ml de cloroformo 25 ml de metanol y 5 ml de agua destilada)

b) Transferir la mezcla de solventes + muestra a un embudo de separacioacuten

c) Antildeadir agua destilada (1 ml) mezclar y dejar formar la bicapa

d) Colectar la capa de cloroformo dentro de un matraz bola fondo plano a peso

constante

e) Antildeadir 5 ml de Metanol y 40 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

f) Antildeadir 5 ml de Metanol y 20 ml de Cloroformo mezclar y colectar la capa de

cloroformo dentro de un matraz bola fondo plano a peso constante

g) Extraccioacuten de solventes (Soxhlet) y caacutelculo del de liacutepidos

ExtraccioacutenPrimera

ExtraccioacutenSegunda

ExtraccioacutenTercera

42

Figura 32 Extraccioacuten de liacutepidos a traveacutes del meacutetodo propuesto por Bligh y Dyer A) Matraz a peso constante sin aceite B) peso de

muestra (g)

A B

A y B

Figura 32 Continuacioacutenhelliphelliphellip C) Extraccioacuten de aceite en embudos de separacioacuten D) Extraccioacuten de solvente (Soxhlet)

C

D

D

Figura 32 Continuacioacutenhelliphelliphellip E) Matraces con aceite en estufa F) Matraces con aceite a peso constante

EF

F

( ) ( )100

SecaMuestra de Gramos

MatrazCtePesoAceiteMatrazCtePesoAceite timesminus+=

36 Disentildeo experimental y anaacutelisis estadiacutestico

El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue bloques

incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de 38

parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores incluyeron

repeticiones grupos y familias y se aplicoacute el siguiente modelo lineal

( ) ijkijkijiijk EGRFRGY +++++= micro

Donde

micro = media general

i = 1 2hellip g (grupos)

j = 1 2 (repeticiones)

k = 1 2hellip f (familias)

iG = efecto del i-eacutesimo grupo

jR = efecto de la j-eacutesima repeticioacuten

kiF = efecto de la k-eacutesima familia anidada en el i-eacutesimo grupo

( )ijGR = efecto de la interaccioacuten del i-eacutesimo grupo por la j-eacutesima repeticioacuten

ijkE = efecto del error experimental

ijkY = observacioacuten de la k-eacutesima familia anidada en el i-eacutesimo grupo de la j-eacutesima

repeticioacuten

46

Se realizaron anaacutelisis de varianza en el software de anaacutelisis de datos R Versioacuten

260 (R Development Core Team 2006) para altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios y contenido de aceite de aquenios para determinar

diferencias estadiacutesticas entre las 133 liacuteneas consideradas para el anaacutelisis de QTLrsquos

incluyendo asimismo los dos progenitores utilizados en los cruzamientos inter-

subespeciacuteficos

37 Anaacutelisis geneacutetico

Se realizoacute un ANOVA por locus individual no ligado (anaacutelisis de marcadores

individuales) en el software para anaacutelisis de datos R Versioacuten 260 (R Development Core

Team 2006) para determinar alguna posible asociacioacuten caraacutecter-marcador para cada

caraacutecter evaluado

En cuanto a los anaacutelisis de QTLrsquos se tomoacute como base el mapa geneacutetico basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Se utilizoacute el enfoque analiacutetico de mapeo por

intervalos (Lander y Botstein 1989) para la identificacioacuten de QTLrsquos y estimacioacuten de sus

efectos fenotiacutepicos con el uso del paquete MapQTLreg Versioacuten 40 (Van Ooijen et al

2002)

Se realizaron pruebas de permutacioacuten (Churchill y Doerge 1994 Doerge y

Churchill 1996) para establecer los valores criacuteticos de los estadiacutesticos de prueba

solamente para aquellos grupos de ligamiento con un LOD score mayor que 15

47

IV RESULTADOS Y DISCUSIOacuteN

Liacuteneas endogaacutemicas recombinantes (RILrsquos)

De las plantas correspondientes a las 29 liacuteneas adicionales (liacuteneas derivadas de F3

en F4) para obtener las liacuteneas endogaacutemicas recombinantes se obtuvo un promedio de 93

aquenios por liacutenea considerando solamente el 7586 de las liacuteneas con respecto al total

El resto de las liacuteneas adicionales (2414) presentoacute un 100 de mortalidad de plantas

Anaacutelisis estadiacutestico

Evaluacioacuten fenotiacutepica replicada

Se observaron diferencias significativas en cuanto a repeticiones solamente para

el caraacutecter contenido de aceite de aquenios con un valor de P igual a 22 x 10 -16

(Cuadro 41) Se observaron diferencias significativas entre grupos para altura de

planta nuacutemero de capiacutetulos y contenido de aceite de aquenios con un valor de P igual a

00004464 2237 x 10 -06 y 5896 x 10 -07 respectivamente En cuanto a diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios los resultados obtenidos del anaacutelisis no indican

significancia entre grupos (Cuadro 41) En cuanto a la interaccioacuten de repeticiones por

grupos se observoacute significancia altura de planta y nuacutemero de aquenios con un valor de P

igual a 00443265 y 008072 Sin embargo para los caracteres nuacutemero y diaacutemetro de

capiacutetulos asiacute como peso de aquenios y contenido de aceite de aquenios no hubo

significancia en la interaccioacuten de repeticiones por grupos (Cuadro 41) Se detectaron

diferencias significativas entre familias dentro de grupos para los caracteres altura de

planta nuacutemero de capiacutetulos mostrando un valor de P igual a 22 x 10 -16 para los dos

caracteres Asimismo para el diaacutemetro de capiacutetulos nuacutemero y peso de aquenios y

contenido de aceite de aquenios se detectaron diferencias significativas con un valor de

P igual a 00001479 002641 20 x 10-16 y 272 x 10-15 respectivamente entre familias

dentro de grupos (Cuadro 41)

De acuerdo a las diferencias significativas encontradas entre familias dentro de

grupos para seis caracteres evaluados se infiere la existencia de variacioacuten geneacutetica en la

poblacioacuten para los caracteres evaluados Por uacuteltimo el contenido de aceite de aquenios

en 83 liacuteneas de girasol fluctuoacute de 2016 a 4310 En este contexto Burke et al (2005)

reportaron un contenido de aceite de 40 en girasol cultivado y 26 en girasol

silvestre

Anaacutelisis geneacutetico

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios denominado (PA-G11) (Figura 41) Este QTL asociado al locus marcador

M208P1E-ACCM-CAC (posicioacuten del marcador 0 cM en grupo de ligamiento) presentoacute

un efecto aditivo estimado de 0206332 y explicoacute el 102 de la varianza fenotiacutepica

(Figuras 41B y 41C)

49

Cuadro 41 Cuadrados medios para seis caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

Caracteres evaluadosdagger

FV AP NC DC NA PA CA

Repeticiones 00519 NS 178 NS 0160 NS 87 NS 0129 NS 008397

Grupos 01214 3695 1660 NS 312 NS 0311 NS 000928

Rep x Grupos 00525 589 NS 1720 NS 1627 0267 NS 000132 NS

Familiasgrupos 00895 2860 2470 1003 1214 000465

Error Residual 00190 341 1138 708 0166 000072

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g) CA = contenido de aceite de aquenios ()

Significativo al 005 de probabilidad

Significativo al 001 de probabilidad

Significativo al lt0001 de probabilidad

NS = No significativo

Asimismo se detectoacute un QTL sugestivo para peso de aquenios (PA-G3) ligado al

marcador M263P1E-ACCM-CAT (posicioacuten del marcador 0 cM en grupo de

ligamiento) el cual explicoacute un porcentaje mayor de la varianza fenotiacutepica con respecto a

PA-G11 (Cuadro 42 Figura 41C)

Estos dos QTLrsquos explicaron de manera simultaacutenea el 221 de la variacioacuten

fenotiacutepica observada para este caraacutecter Se detectaron otros cuatro QTLrsquos sugestivos

distribuidos en cuatro de los 17 grupos de ligamiento afectando los caracteres altura de

planta (AP-G2) nuacutemero de capiacutetulos (NC-G4) diaacutemetro de capiacutetulos (DC-G12) y

nuacutemero de aquenios (NA-G17) los cuales explicaron de 71 al 103 de la varianza

fenotiacutepica observada (Cuadro 42)

Dos QTLrsquos sugestivos para los caracteres nuacutemero y diaacutemetro de capiacutetulos (NC-

G4 y DC-G12 respectivamente) presentaron efectos aditivos negativos con respecto al

progenitor cultivado El efecto negativo observado en el caraacutecter diaacutemetro de capiacutetulos

pudo deberse a un fenoacutemeno bioloacutegico o a error de muestreo Los valores bajos en

cuanto a LOD score (le114) detectados para el contenido de aceite se debieron

probablemente al tamantildeo de muestra ya que de los 133 individuos considerados en el

mapa geneacutetico solamente el 624 de estos contaron con datos cuantitativos para este

caraacutecter Se determinoacute al efecto aditivo de cada QTL identificado considerando el

efecto como positivo cuando la media estimada del caraacutecter cuantitativo asociado a los

alelos (HA89) fue mayor con respecto a la media de los alelos silvestres (AP-G2 NA-

G17 PA-G3) y (PG-G11) (Cuadro 42 Figuras 41B y 41D)

51

Figura 41 Perfiles de un QTL con significancia de amplitud genoacutemica para peso de aquenios en el grupo de ligamiento 11

denominado PA-G11 (A) Lod score (B) efectos aditivos (C) varianza fenotiacutepica explicada por el QTL () y (D) media estimada de

la distribucioacuten del caraacutecter peso de aquenios (g)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

20

0 10 20 30

Distancia mapa ( cM )

LOD score (A)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

00

10

0 10 20 30

Distancia mapa ( cM )

Efectos aditivos (B)

Figura 41 Continuacioacutenhelliphelliphellip

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa ( cM )

Porcentaje de la varianza

fenot iacute pica (C)

10 20 30 40 50 60 70 80 90

100 110 120

0 10 20 30

Distancia mapa

Porcentaje de la varianza

fenot iacute pica (C)

( cM )

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

00

10

0 10 20 30

Distancia mapa ( cM )

PA ndash Girasol cultivado PA ndash Girasol silvestre (D)

Cuadro 42 Resultados del anaacutelisis de QTLrsquos a traveacutes de mapeo por intervalos para caracteres relacionados a la domesticacioacuten del

girasol en una poblacioacuten segregante F2F3

Mapeo por Intervalos

Caraacutecterdagger QTLdaggerdagger Posicioacuten

(cM) daggerdaggerdagger

Locus Marcador

Flanqueante Lod score PVFpara AGφ ACφφ

Efectos

Aditivos

AP AP-G2 50 M243P1E-AGCM-CAT 194 103 0204 0012 00953084

NC NC-G4 00 M434P1E-ACGM-CAA 224 90 0085 0005 -821146

DC DC-G12 00 M323P1E-AGGM-CAC 162 71 0170 0010 -0452724

NA NA-G17 225 M307P1E-AGCM-CAT 153 85 0187 0011 892463

PA PA-G3 00 M263P1E-ACCM-CAT 192 119 0085 0005 0238776

PA PA-G11 00 M208P1E-ACCM-CAC 189 102 0017 0001 0206332

dagger AP = Altura de planta (m) NC = nuacutemero de capiacutetulos DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de aquenios PA = peso de

aquenios (g)

daggerdagger La descripcioacuten de cada QTL se basa de acuerdo a la abreviacioacuten de cada caraacutecter y al grupo de ligamiento en el mapa de ligamiento

geneacutetico

daggerdaggerdagger Posicioacuten del QTL con respecto al primer locus marcador flanqueante

para Porcentaje de la varianza fenotiacutepica explicada por el QTL

φ Significancia estadiacutestica de amplitud genoacutemica

φφ Significancia estadiacutestica de amplitud cromosoacutemica

Por el contrario se consideroacute como efecto negativo (QTLrsquos con efectos aditivos

en direccioacuten opuesta) cuando la media estimada del caraacutecter cuantitativo asociado al

genotipo silvestre fue mayor con respecto al genotipo cultivado (NC-G4 DC-G12) por

lo que la direccionalidad de los efectos aleacutelicos dependen en gran parte del fondo

geneacutetico

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci significativos de los 168 loci polimoacuterficos no ligados al mapa geneacutetico

asociados a los ocho caracteres evaluados de los cuales uno se encuentra potencialmente

asociado al caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter

diacuteas a madurez fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT

M177P1E-ACCM-CTT) a una significancia igual a P lt0001 (Cuadro 43) Lo

anterior representa el 4615 de los 208 bandas polimoacuterficas consideradas para el

anaacutelisis de ligamiento

Por otra parte se registraron asociaciones QTL-marcador de manera significativa

al 0001 de probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci

marcadores para siete caracteres evaluados de los cuales tres M217P2E-ACCM-CTT

M281P1E-ACAM-CAG y M372P2E-ACCM-CTT se asociaron a dos caracteres

diferentes (DMF-CA NA-PA y AP-DMF respectivamente) (Cuadro 43) Por otra

parte tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del

progenitor HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y

250 respectivamente (Cuadro 43)

55

Cuadro 43 Loci marcadores no ligados con significancia al 0001 de probabilidad para

caracteres relacionados a la domesticacioacuten del girasol en una poblacioacuten segregante F2F3

a traveacutes del meacutetodo de marcador individual (ANOVA)

Marcador Individual (ANOVA)

Caraacutecter dagger Locus marcador Caraacutecter dagger Locus marcador

AP M84P1E-ACGM-CAA DMF M469P1E-ACCM-CTT

AP M372P2E-ACCM-CTT DMF M342P1E-ACCM-CTT

DC M312P2E-ACAM-CAG DMF M243P1E-ACCM-CTT

DC M160P1E-AAGM-CAA DMF M194P1E-ACCM-CTT

DC M253P1E-ACGM-CAA DMF M189P1E-ACCM-CTT

DC M221P1E-AGCM-CTT DMF M155P1E-ACCM-CTT

NA M281P1E-ACAM-CAG DMF M151P1E-ACCM-CTT

PA M281P1E-AGCM-CAT DMF M134P1E-ACCM-CTT

PA M281P1E-ACAM-CAG DMF M89P1E-ACCM-CTT

DF M180P1E-ACGM-CAA DMF M372P2E-ACCM-CTT

DMF M416P1E-ACCM-CTT DMF M217P2E-ACCM-CTT

DMF M166P1E-ACCM-CTT CA M209P1E-AGCM-CAA

DMF M324P2E-ACCM-CTT CA M217P2E-ACCM-CTT

DMF M305P2E-ACCM-CTT CA M155P2E-AGCM-CTT

DMF M364P1E-ACGM-CAA CA M92P2E-ACCM-CAC

DMF M162P1E-AGGM-CAC

dagger AP = Altura de planta (m) DC = diaacutemetro de capiacutetulos (cm) NA = nuacutemero de

aquenios PA = peso de aquenios (g) DF = diacuteas a floracioacuten DMF = diacuteas a madurez

fisioloacutegica CA = contenido de aceite de aquenios ()

56

Se detectaron dos loci marcadores (bandas polimoacuterficas) con igual nuacutemero de

pares de bases y una significancia al 0001 de probabilidad a traveacutes del anaacutelisis de

marcadores individuales para peso de aquenios con diferente combinacioacuten de bases

restrictivas del oligonucleoacutetido EcoRI y MseI (Cuadro 43)

57

V CONCLUSIONES

Se obtuvo un promedio de 93 aquenios por liacutenea adicional (liacuteneas derivadas de F3

en F4) en el 7586 de estas con respecto al total en la formacioacuten de liacuteneas endogaacutemicas

recombinantes (RILrsquos)

La evaluacioacuten fenotiacutepica demuestra gran variabilidad geneacutetica entre la poblacioacuten

Se encontraron 96 loci significativos asociados a ocho caracteres especiacuteficamente

al caraacutecter nuacutemero de aquenios y diacuteas a madurez fisioloacutegica a una significancia igual a P

lt0001

El mapeo por intervalos identificoacute un QTL con significancia de amplitud

genoacutemica de 0017 para peso de aquenios en el grupo de ligamiento 11 y cinco QTLrsquos a

nivel sugestivo

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 a traveacutes del meacutetodo Blight y Dyer

VI RESUMEN

La identificacioacuten de loci de caracteres cuantitativos (QTLrsquos) es de suma

importancia para proporcionar un medio de respuesta con respecto al control geneacutetico de

los caracteres cuantitativos

El objetivo fundamental del presente trabajo fue detectar posiciones de QTLrsquos y

estimar sus efectos geneacuteticos especialmente aquellos relacionados con la domesticacioacuten

del girasol Se trabajoacute con ocho caracteres altura de planta nuacutemero y diaacutemetro de

capiacutetulos nuacutemero y peso de aquenios diacuteas a floracioacuten diacuteas a madurez fisioloacutegica y

contenido de aceite de aquenios Para este uacuteltimo se utilizoacute el meacutetodo para extraccioacuten de

liacutepidos propuesto por Bligh y Dyer (1959)

El presente trabajo se desarrolloacute en la Universidad Autoacutenoma Agraria ldquoAntonio

Narrordquo cuyas coordenadas geograacuteficas son 25ordm 22rsquo de latitud y 101ordm 00rsquo de longitud W

con altitud de 1754 m para la produccioacuten de plaacutentula Por otra parte las labores de

transplante (evaluacioacuten fenotiacutepica replicada) se realizaron en el Campo Agriacutecola

Experimental de la Universidad Autoacutenoma Agraria Antonio Narro en Navidad N L

localizado a 27ordm 04rsquo N y 100ordm 56rsquo O con altitud de 1895 m

Se utilizoacute la poblacioacuten de mapeo ldquoCorrecaminos F23rdquo conformada por 149 liacuteneas

derivadas de F2 en F3 incluyendo los dos progenitores (liacutenea cultivada HA89 y un

material silvestre proveniente de una colecta realizada en Saltillo Coahuila identificado

como Ac-8-2) El disentildeo experimental utilizado para la evaluacioacuten fenotiacutepica fue

bloques incompletos al azar con dos repeticiones utilizando cuatro grupos (bloques) de

38 parcelas por repeticioacuten Cada parcela consistioacute de cuatro plantas Los factores

incluyeron repeticiones grupos y familias

Se establecioacute un lote de autofecundacioacuten para 29 liacuteneas adicionales con cuatro

plantas por parcela y una repeticioacuten con la finalidad de formar liacuteneas endogaacutemicas

recombinantes de girasol (RILrsquos) de las cuales se obtuvo un promedio de 93 aquenios

por liacutenea

Para llevar a cabo los anaacutelisis de QTLrsquos se utilizoacute el software MapQTL 40

tomando como base un mapa de ligamiento geneacutetico de baja densidad basado en

marcadores AFLP Se consideroacute un nivel de significancia estadiacutestica de amplitud

genoacutemica de 005 en la deteccioacuten de QTLrsquos Para establecer los valores criacuteticos de los

estadiacutesticos de prueba se realizaron pruebas de permutacioacuten solamente para aquellos

grupos de ligamiento con un LOD score gt15 Para determinar alguna posible asociacioacuten

caraacutecter-marcador se realizoacute un ANOVA por locus individual no ligado para cada

caraacutecter evaluado en el software de anaacutelisis de datos R (versioacuten 260)

El anaacutelisis de marcadores individuales (asociacioacuten locus marcador-QTL)

identificoacute 96 loci no ligados (representando el 4615 de los 208 bandas polimoacuterficas

60

consideradas para el anaacutelisis de ligamiento) distribuidos en los ocho caracteres

evaluados de los cuales uno se encuentra potencialmente asociado (P lt0001) al

caraacutecter nuacutemero de aquenios (M120P1E-AGCM-CAA) y tres al caraacutecter diacuteas a madurez

fisioloacutegica (M290P1E-ACCM-CTT M486P2E-ACCM-CTT M177P1E-ACCM-

CTT)

Se registraron asociaciones QTL-marcador de manera significativa al 0001 de

probabilidad a traveacutes del anaacutelisis de marcadores individuales en 28 loci marcadores para

siete caracteres evaluados de los cuales tres se asociaron a dos caracteres diferentes

Tomando como base las 28 bandas polimoacuterficas 21 de estas provinieron del progenitor

HA89 y siete del progenitor silvestre (Ac-8-2) representando el 750 y 250

respectivamente

Se detectoacute un QTL con significancia de amplitud genoacutemica de 0017 para peso

de aquenios Se detectaron cinco QTLrsquos sugestivos distribuidos en cuatro de los 17

grupos de ligamiento afectando los caracteres altura de planta nuacutemero de capiacutetulos

diaacutemetro de capiacutetulos nuacutemero de aquenios y peso de aquenios Los QTLrsquos detectados

(incluyendo sugestivos) explicaron de 71 al 119 de la varianza fenotiacutepica para cinco

caracteres evaluados

El contenido de aceite de aquenios en 83 liacuteneas de girasol fluctuoacute de 2016 a

4310 Este estudio contribuiraacute al conocimiento de la geneacutetica de la domesticacioacuten del

girasol asiacute como en la generacioacuten de marcadores para seleccioacuten con fines de

61

mejoramiento geneacutetico dirigido a la introgresioacuten de caracteres silvestres a variedades de

girasol elite

62

VII LITERATURA CITADA

Arias M D and L H Rieseberg 1995 Genetic relationships among domesticated and

wild sunflowers (Helianthus annuus Asteraceae) Economic Botanic 49239-

248

Berry S T A J Leon C C Hanfrey P Challis A Burkholz S R Barnes G K

Rufener M Lee and P D S Caligari 1995 Molecular marker analysis of

Helianthus annuus L2 Construction of a RFLP linkage map for cultivated

sunflower Theoretical and Applied Genetics 91195-199

Bligh E G and W J Dyer 1959 A rapid method of total lipid extraction and

purification Canadian Journal of Biochemistry and Physiology 37(8)911-917

Burke J M S Tang S J Knapp and L H Rieseberg 2002 Genetic analysis of

sunflower domestication Genetics 1611257-1267

Burke J M Z Lai M Salmaso T Nakazato S X Tang A Heesacker S J

Knapp and L H Rieseberg 2004 Comparative mapping and rapid

karyotypic evolution in the genus Helianthus Genetics 167449-457

Burke J M S J Knapp and L H Rieseberg 2005 Genetic consequences of selection

during the evolution of cultivated sunflower Genetics 1711933-1940

Carlborg O L Andersson and B Kinghorn 2000 The use of a genetic algorithm for

simultaneous mapping of multiple interacting quantitative trait loci Genetics

1552003-2010

Castillo R F 2005 Construccioacuten de un mapa geneacutetico de girasol (Helianthus annuus

L) basado en marcadores AFLPrsquos Tesis Maestriacutea en Ciencias UAAAN

Buenavista Saltillo Coahuila Meacutexico 46 p

Churchill G A and R W Doerge 1994 Empirical threshold values for quantitative

trait mapping Genetics 138963-971

Cockerham C C 1954 An extension of the concept of partitioning hereditary variance

for analysis of covariances among relatives when epistasis is present Genetics

39859-882

Darvasi A and J I Weller 1992 On the use of the moments method of estimation to

obtain approximate maximum likelihood estimation of linkage between a genetic

marker and a quantitative locus Heredity 6843-46

Darwin C 1858 On the Origin of Species by Means of Natural Selection (Murray

London)

Doerge R W and G A Churchill 1996 Permutation tests for multiple loci affecting a

quantitative character Genetics 142285-294

Doerge R W and A Rebai 1996 A significance thresholds for QTL mapping tests

Heredity 76459-464

Doerge R W 2002 Mapping and analysis of quantitative trait loci in experimental

populations Nat Rev 343-52

Doerge R W Z-B Zeng and B S Weir 1997 Statistical issues in the search for genes

affecting quantitative traits in experimental populations Stat Sci 12(3)195-219

Efron B and R J Tibshirani 1993 An Introduction to the Bootstrap (Chapman and

Hall New York)

Elston R C and J Stewand 1973 The analysis of quantitative traits for simple genetic

models from parental F1 and backcross data Genetics 73695-711

64

Falconer D S and T F C Mackay 1996 Introduction to Quantitative Genetics Ed 4

Longman Harlow UK

Feenstra B and Ib M Skovgaard 2004 A quantitative trait locus mixture model that

avoids spurious LOD score peaks Genetics 167959-965

Fisher R 1935 The Design of Experiments 3rd edn (Oliver and Boyd London)

Foster J A 2001 Evolutionary computation Nature Rev Genet 2428-436

Frankel W N and N J Schork 1996 Whorsquos afraid of epistasis Nat Genet 14371-

373

Gentzbittel L F Fear Y-X Zhang A Bervilleacute and P Nicolas 1995 Development of a

consensus linkage RFLP map of cultivated sunflower (Helianthus annuus L)

Theor Appl Genet 901079-1086

Haley C S and S A Knott 1992 A simple regression method for mapping

quantitative trait loci in line crosses using flanking markers Heredity 69315-

324

Haley C S S A Knott and J M Elsen 1994 Mapping quantitative trait loci in

crosses between outbred lines using least squares Genetics 1361195-1207

Haro-Ramiacuterez P A M C J Garciacutea y M H Reyes-Valdeacutes 2007 Determinacioacuten

maternal del contenido de aceite en semillas de girasol Rev Fitotec Mex

30(1)39-42

Harter A V K A Kardnert D Falush D L Lentz R A Bye and L H Rieseberg

2004 Origin of extant domesticated sunflowers in eastern North America

Nature 430201-204

Heiser C B 1978 Taxonomy of Helianthus and origin of the domesticated sunflower

Sunflowers Science and Technology ASA CSSA and ASSA Madison WI pp

31-53

65

Hill A P 1975 Quantitative linkage A statistical procedure for its detection and

estimation Ann Hum Genet Land 38439-559

Hoeschele I and P M VanRaden 1993 Bayesian analysis of linkage between genetic

markers and quantitative trait loci I Prior knowledge Theor Appl Genet 85

953-960

Jan C C B A Vick J F Miller A L Kahler and E T Butler 1998 Construction of

an RFLP linkage map for cultivated sunflower Theor Appl Genet 9615-22

Jansen R C 1993 Interval mapping of multiple quantitative trait loci Genetics 135

205-211

Kao C-H 1995 Statistical methods for locating positions and analyzing epistasis of

multiple quantitative trait genes using molecular marker information

Dissertation of Department of Statistics at North Carolina State University

Kao C-H 2000 On the differences between maximum likelihood and regression

interval mapping in the analysis of quantitative trait loci Genetics 156855-865

Kempthorne O 1957 An Introduction to Genetic Statistics The Iowa State University

Press Ames Iowa

Kosambi D D 1944 The estimation of map distances from recombination values

Annals of Eugenics 12172-175

Knapp S J J W C Bridges and D Brikes 1990 Mapping quantitative trait loci using

molecular marker linkage maps Theor Appl Genet 79583-592

Lander E S P Green J Abrahamson A Barlow M J Daly S E Lincoln and L

Newburg 1987 MAPMAKER an interactive computer package for constructing

primary genetic linkage maps of experimental and natural populations Genomics

1174-181

Lander E S and D Botstein 1989 Mapping mendelian factors underlying quantitative

traits using RFLP linkage maps Genetics 121185-199 erratum 136 705 (1994)

66

Lander E and L Kruglyak 1995 Genetic dissection of complex traits guidelines for

interpreting and reporting linkage results Nat Genet 11241-247

Langar K M Lorieux E Desmarais Y Griveau Gentzbittel and Bervilleacute 2003

Combined mapping of DALP and AFLP markers in cultivated sunflower using

F9 recombinant inbred lines Theor Appl Genet 1061068-1074

Lawson W R K C Goulter R J Henry G A Kong and J K Kochman 1998

Marker-assisted selection for two rust resistance genes in sunflower Mol Breed

4227-234

Leoacuten A J F H Andrade and M Lee 2003 Genetic analysis of seed-oil

concentrations across generations and environments in sunflower (Helianthus

annuus L) Crop Science 43135-140

Lentz D L M E D Pohl K O Pope and A R Wyatt 2001 Prehistoric sunflower

(Helianthus annuus L) domestication in Mexico Econ Bot 55370-376

Luo Z W and M J Kearsey 1991 Maximum likelihood estimation of linkage

between a marker gene and a quantitative locus II Application to backcross and

doubled haploid populations Heredity 66117-124

Lystig T C 2003 Adjusted P values for genome-wide scans Genetics 1641683-1687

Mackay T F C 1996 The nature of quantitative genetic variation revisited Lessons

from Drosophila bristles BioEssays 18113-121

Martiacutenez O and R N Curnow 1992 Estimating the locations and the sizes of the

effects of quantitative trait loci using flanking markers Theor Appl Genet

85480-488

Mcmillan I and A Robertson 1974 The power of methods for the detection of major

genes affecting quantitative traits Heredity 32349-356

Mokrani L L Gentzbittel F Azanza L Fitamant G Al-Chaarani and A Sarrafi

2002 Mapping and analysis of quantitative trait loci for grain oil content and

67

agronomic traits using AFLP and SSR in sunflower (Helianthus annuus L)

Theor Appl Genet 106149-156

Navarro A and N H Barton 2003 Accumulating postzygotic isolation genes in

parapatry a new twist on chromosomal speciation Evolution 57447-459

Nettleton D and R W Doerge 2000 Accounting for variability in the use of

permutation testing to detect quantitative trait loci Biometrics 5652-58

Noor M A F K L Grams L A Bertucci and J Reiland 2001 Chromosomal

inversions and the persistence of species Proc Natl Acad Sci USA 9812084-

12088

Orr H A 1998a The population genetics of adaptation the distribution of factors fixed

during adaptive evolution Evolution 52935-949

Orr H A 1998b Testing natural selection vs genetic drift in phenotypic evolution

using quantitative trait locus data Genetics 1492099-2104

Orr H A and J A Coyne 1992 The genetics of adaptation revisited Am Nat

140725-742

Paterson A H 1997 Comparative mapping of plant phenotypes Plant Breed Rev

1413-37

Paterson A H J W Deverna B Lanini and S D Tanksley 1990 Fine mapping of

quantitative trait loci using selected overlapping recombinant chromosomes in an

interspecies cross of tomato Genetics 124735-742

Pawlowski S H 1964 Seed genotype and oil percentage relationship between seeds of

a sunflower Can J Genet Cytol 6293-297

Piperno D R 2001 ARCHAEOLOGY On Maize and the Sunflower Science 292

2260-2261

68

Pope K O M E D Pohl J G Jones D L Lentz C von Nagy F J Vega and I R

Quitmyer 2001 Origin and environmental setting of ancient agriculture in the

lowlands of Mesoamerica Science 2921370-1373

R Development Core Team 2006 R A language and environment for statistical

computing R Foundation for Statistical Computing Vienna Austria

httpwwwR-projectorg

Rebaiuml A B Goffinet and B Mangin 1994 Approximate thresholds of interval

mapping tests for QTL detection Genetics 138235-240

Rebaiuml A B Goffinet and B Mangin 1995 Comparing power of different methods for

QTL detection Biometrics 5187-99

Rieseberg L H and G J Seiler 1990 Molecular evidence and the origin and

development of the domesticated sunflower (Helianthus annuus Asteraceae)

Econ Bot 4479-91

Rieseberg L H R Carter and S Zona 1990 Molecular tests of the hypothesized

hybrid origin of two diploid Helianthus species (Asteraceae) Evolution 44

1498-1511

Rieseberg L H 1991 Homoploid reticulate evolution in Helianthus evidence from

ribosomal genes Am J Bot 781218-237

Rieseberg L H O Raymond D M Rosenthal Z Lai K D Livingstone T Nakazato

J L Durphy A E Schwarzbach L A Donovan and C Lexer 2003 Major

ecological transitions in wild sunflowers facilitated by hybridization Science

3011211-1216

Rodriguez de la Paz J 2005 Formacioacuten de una poblacioacuten de mapeo geneacutetico en

girasol (Helianthus annuus L) y evaluacioacuten comparativa de apareamiento

cromosoacutemico Tesis Doctor en Ciencias UAAAN Buenavista Saltillo

Coahuila Meacutexico 73 p

69

Rosenthal D A E Schwarzbach L A Donovan O Raymond and L H Rieseberg

2002 Phenotypic differentiation between three ancient hybrid taxa and their

parental species Int J Plant Sci 163387-98

Satagopan J M B S Yandell M A Newton and T C Osborn 1996 A Bayesian

approach to detect quantitative trait loci using Markov Chain Monte Carlo

Genetics 144 805-816

Schneiter A A and J F Miller 1981 Description of sunflower growth stages Crop

Science 21901-903

Seiler G J 1992 Utilization of wild sunflower species for the improvement of

cultivated sunflower Field Crop Research 30195-230

Seiler G J and L H Rieseberg 1997 Systematics origin and germoplasm resources

of the wild and domesticated sunflower ASA CSSA SSSA Sunflower

Technology and Production Agronomy Monograph no 35 Madison WI USA

pp21-65

Sen S J M Satagopan and G A Churchill 2005 Quantitative trait locus study design

from an information perspective Genetics 170447-464

Seung-Chul L and H Rieseberg 1999 Genetic architecture of species differences in

annual sunflowers Implications for adaptive trait introgression Genetics

153965-977

Schilling E E and C B Heiser 1981 Intrageneric classification of Helianthus

(Compositae) Taxon 30393-403

Shrimpton A E and A Robertson 1988 The isolation of polygenic factors controlling

bristle score in Drosophila melanogaster I Allocation of third chromosome

sternopleural bristle effects to chromosome sections Genetics 118437-443

Sillanpaumlauml M J and E Arjas 1999 Bayesian mapping of multiple quantitative trait loci

from incomplete outbred offspring data Genetics 1511605-1619

70

Soller M T Brody and A Genizi 1976 In the power of experimental designs for the

detection of linkage between marker loci and quantitative loci in crosses between

inbred lines Theor Appl Genet 4735-39

Tang S J K Yu M B Slabaugh D K Shintani and S J Knapp 2002 Simple

sequence repeat map of the sunflower genome Theor Appl Genet 1051124-

1136

Thompson T E G N Fick and J R Cedeno 1979 Maternal control of seed oil

percentage in sunflower Crop Science 19617-619

Timmerman-Vaughan G A J A McCallum T J Frew N F Weeden and A C

Russell 1996 Linkage mapping of quantitative trait loci controlling seed weight

in pea (Pisum sativum L) Theor Appl Genet 93431-439

Uimari P and I Hoeschele 1997 Mapping-linked quantitative trait loci using

Bayesian analysis and Markov Chain Monte Carlo algorithms Genetics 146735-

743

United States Department of Agriculture (USDA) 2008 httpplantsusdagov Rev 04

de marzo de 2008

Van Ooijen J W 1999 LOD significance thresholds for QTL analysis in experimental

populations of diploid species Heredity 83613-624

Van Ooijen J W and R E Voorrips 2001 JoinMapreg 30 Software for the

calculation of genetic linkage maps Plant Research International Wageningen

the Netherlands

Van Ooijen J W M P Boer R C Jansen and C Maliepaard 2002 MapQTLreg 40

Software for the calculation of QTL positions on genetic maps Plant Research

International Wageningen The Netherlands

Varshney M R Prasad N Kumar H S Harjit-Singh and P K Gupta 2000

Identification of eight chromosomes and a microsatellite marker on 1AS

71

associated with QTL for grain weight in bread wheat Theor Appl Genet

81290-1294

Visscher P M R Thompson and C S Haley 1996 Confidence intervals in QTL

mapping by bootstrapping Genetics 1431013-1020

Vos P R Hogers M Bleeker M Reijans T Van de Lee M Hornes A Frijters J

Pot J Peleman M Kuiper and M Zabeau 1995 AFLP A new technique for

DNA fingerprinting Nucleic Acids Res 234407-414

Weller J I M Soller and T Brody 1988 Linkage analysis of quantitative traits in an

interspecific cross of tomato (Lycopersicon eseulentum times Lycopersicon

pimpinellifolium) by means of genetic markers Genetics 118329-339

West-Eberhard M J 2005 Developmental plasticity and the origin of species

differences Proc Natl Acad Sci USA 1026543-6549

Westfall P H and S S Young 1993 Resampling-Based Multiple Testing Examples

and Methods for P-Value Adjustment John Wiley and Sons New York

Wolfram S 2003 Software Mathematica version 50 Wolfram Research Inc

Xu S 1995 A comment on the simple regression method for interval mapping

Genetics 1411657-1659

Yu J K S Tang M B Slabaugh A Heesacker G Cole M Herring J Soper F

Han W C Chu D M Webb L Thompson K J Edwards S Berry A J

Leon G Grondona C Olungu N Maes and S J Knapp 2003 Towards a

saturated molecular genetic linkage map for cultivated sunflower Crop Science

43367-387

Zeng Z-B 1993 Theoretical basis for separation of multiple linked gene effects in

mapping quantitative trait loci Proc Natl Acad Sci USA 9010972-10976

Zeng Z-B 1994 Precision mapping of quantitative trait loci Genetics 1361457-1468

72

Zeng Z-B 2005 QTL mapping and the genetic basis of adaptation recent

developments Genetica 12325-37

Zeng Z-B C-H Kao and C J Basten 1999 Estimating the genetic architecture of

quantitative traits Genet Res 74279-289

Zeng Z-B T Wang and W Zou 2005 Modeling quantitative trait loci and

interpretation of models Genetics 1691711-1725

Zhang Y-M and S Xu 2004 Mapping quantitative trait loci in F2 incorporating

phenotypes of F3 progeny Genetics 1661981-1993

Zou F J P Fine J Hu and D Y Lin 2004 An efficient resampling method for

assessing genome-wide statistical significance in mapping quantitative trait loci

Genetics 1682307-2316

73

VIII APEacuteNDICE

Figura A1 Mapa de ligamiento geneacutetico de girasol basado en una poblacioacuten de 133 liacuteneas F23 derivada de un cruzamiento entre girasol

cultivado (Helianthus annuus L var macrocarpus (DC) Cockerell HA89) y silvestre (Helianthus annuus L ssp texanus Heiser) con

marcadores AFLP con 40 loci distribuidos en 17 grupos de ligamiento

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

30538

31658

M243P1E - AGCM - CAT 0000

M84P1E - AGCM - CAT 30538

M84P2E - ACCM - CAT 62196

G2

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

19311

1191

13343

22277

9000

M170P1E - ACCM - CTT 0000

M383P1E - AGCM - CAT 19311 M220P1E - ACCM - CTT 20502

M258P1E - ACCM - CAC 33845

M114P1E - ACCM - CAC 56122

M138P1E - ACCM - CTT 65122

G1

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

28524

28973

M263P1E - ACCM - CAT 0000

M186P2E - ACCM - CAT 28524

M297P1E - ACCM - CTT 57497

G3

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

30215

M434P1E - ACGM - CAA 0000

M205P2E - ACCM - CAA 30215

G4

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

32865

M129P1E - ACCM - CAA 0000

M197P2E - AGCM - CAA 32865

G5

Figura A1 Continuacioacutenhelliphelliphellip

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

22082

M181P1E - ACCM - CAC 0000

M98P1E - ACCM - CAC 22082

G7

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30793

M64P2E - ACAM - CAG 0000

M77P2E - ACAM - CAG 3 0793

G8

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

30625

M82P1E - ACAM - CAG 0000

M170P1E - ACAM - CAG 30625

G9

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

25712

M376P1E - ACGM - CAA 0000

M166P1E - ACGM - CAA 25712

G10

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

33923

M123P1E - ACCM - CTT 0000

M181P1E - ACCM - CTT 33923

G6

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30506

M208P1E - ACCM - CAC 0000

M169P1E - ACCM - CAC 30506

G11

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

30543

M323P1E - AGGM - CAC 0000

M320P1E - ACCM - CAT 30543

G12

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

24067

M320P1E - AGCM - CAA 0000

M86P2E - AGGM - CAC 24067

G13

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

32682

M111P1E - ACCM - CTT 0000

M235P1E - ACCM - CTT 32682

G14

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

21182

M175P1E - ACCM - CAT 0000

M198P1E - ACCM - CTT 21182

G15

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

22524

M311P1E - AGCM - CAA 0000

M307P1E - AGCM - CAT 22524

G17

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

28918

M155P1E - ACCM - CAT 0000

M226P2E - AGCM - CAT 28918

G16

Cuadro A1 Polimorfismos utilizados para obtener el mapa de ligamiento

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

1 M431P1E-AAGM-CAA 14 M116P1E-AGGM-CAC 27 para M155P1E-ACCM-CAT 40 M198P1E-ACAM-CAG

2 M357P1E-AAGM-CAA 15 M110P1E-AGGM-CAC 28 M149P1E-ACCM-CAT 41 M186P1E-ACAM-CAG

3 M317P1E-AAGM-CAA 16 M201P1E-ACGM-CAA 29 para M383P1E-AGCM-CAT 42 M181P1E-ACAM-CAG

4 M437P1E-AGCM-CAA 17 M84P1E-ACGM-CAA 30 M353P1E-AGCM-CAT 43 M130P1E-ACAM-CAG

5 M328P1E-AGCM-CAA 18 M416P1E-ACCM-CTT 31 M281P1E-AGCM-CAT 44 para M82P1E-ACAM-CAG

6 para M320P1E-AGCM-CAA 19 M290P1E-ACCM-CTT 32 M262P1E-AGCM-CAT 45 M371P1E-AAGM-CAA

7 para M311P1E-AGCM-CAA 20 para M220P1E-ACCM-CTT 33 para M243P1E-AGCM-CAT 46 M255P1E-AGCM-CAA

8 M75P1E-AGCM-CAA 21 M166P1E-ACCM-CTT 34 M193P1E-AGCM-CAT 47 M215P2E-ACCM-CAC

9 para M208P1E-ACCM-CAC 22 para M111P1E-ACCM-CTT 35 M410P1E-ACAM-CAG 48 M118P2E-ACCM-CAA

10 M193P1E-ACCM-CAC 23 M288P1E-AGCM-CTT 36 M281P1E-ACAM-CAG 49 M115P2E-ACCM-CAA

11 M85P1E-ACCM-CAC 24 M183P1E-AGCM-CTT 37 M261P1E-ACAM-CAG 50 M304P2E-ACGM-CAA

12 para M323P1E-AGGM-CAC 25 M137P1E-AGCM-CTT 38 M235P1E-ACAM-CAG 51 M486P2E-ACCM-CTT

13 M129P1E-AGGM-CAC 26 para M175P1E-ACCM-CAT 39 M224P1E-ACAM-CAG 52 M324P2E-ACCM-CTT

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

53 M305P2E-ACCM-CTT 66 para M181P1E-ACCM-CAC 79 M252P1E-AAGM-CAA 92 M215P1E-AGCM-CAA

54 M435P2E-AGCM-CTT 67 para M169P1E-ACCM-CAC 80 M232P1E-AAGM-CAA 93 M209P1E-AGCM-CAA

55 M212P2E-AGCM-CTT 68 M364P1E-ACGM-CAA 81 M223P1E-AAGM-CAA 94 M120P1E-AGCM-CAA

56 M147P2E-AGCM-CTT 69 M343P1E-ACGM-CAA 82 M217P1E-AAGM-CAA 95 M94P1E-AGCM-CAA

57 M63P2E-AGCM-CTT 70 para M235P1E-ACCM-CTT 83 M199P1E-AAGM-CAA 96 M328P1E-ACCM-CAC

58 M301P2E-ACCM-CAT 71 para M123P1E-ACCM-CTT 84 M179P1E-AAGM-CAA 97 para M258P1E-ACCM-CAC

59 M210P2E-AGCM-CAT 72 M341P1E-AGCM-CTT 85 M160P1E-AAGM-CAA 98 M254P1E-ACCM-CAC

60 M89P2E-AGCM-CAT 73 M307P1E-AGCM-CTT 86 M154P1E-AAGM-CAA 99 M202P1E-ACCM-CAC

61 M312P2E-ACAM-CAG 74 M298P1E-AGCM-CTT 87 M109P1E-AAGM-CAA 100 para M114P1E-ACCM-CAC

62 M305P2E-ACAM-CAG 75 M68P1E-AGCM-CTT 88 M298P1E-AGCM-CAA 101 M475P1E-AGGM-CAC

63 para M64P2E-ACAM-CAG 76 M165P1E-AGCM-CAT 89 M293P1E-AGCM-CAA 102 M469P1E-AGGM-CAC

64 M284P2E-AGCM-CAA 77 M385P1E-ACAM-CAG 90 M276P1E-AGCM-CAA 103 M181P1E-AGGM-CAC

65 M318P1E-ACCM-CAC 78 M299P1E-AAGM-CAA 91 M232P1E-AGCM-CAA 104 M174P1E-AGGM-CAC

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

105 M162P1E-AGGM-CAC 118 M180P1E-ACGM-CAA 131 M151P1E-ACCM-CTT 144 M213P1E-ACCM-CAT

106 M136P1E-AGGM-CAC 119 para M166P1E-ACGM-CAA 132 para M138P1E-ACCM-CTT 145 M205P1E-ACCM-CAT

107 M274P1E-ACCM-CAA 120 M132P1E-ACGM-CAA 133 M134P1E-ACCM-CTT 146 M182P1E-ACCM-CAT

108 M213P1E-ACCM-CAA 121 M469P1E-ACCM-CTT 134 M89P1E-ACCM-CTT 147 para M307P1E-AGCM-CAT

109 para M129P1E-ACCM-CAA 122 M342P1E-ACCM-CTT 135 M221P1E-AGCM-CTT 148 M297P1E-AGCM-CAT

110 M122P1E-ACCM-CAA 123 M243P1E-ACCM-CTT 136 M199P1E-AGCM-CTT 149 M154P1E-AGCM-CAT

111 M107P1E-ACCM-CAA 124 para M198P1E-ACCM-CTT 137 M169P1E-AGCM-CTT 150 para M84P1E-AGCM-CAT

112 M464P1E-ACGM-CAA 125 M194P1E-ACCM-CTT 138 M133P1E-AGCM-CTT 151 M64P1E-AGCM-CAT

113 M439P1E-ACGM-CAA 126 M189P1E-ACCM-CTT 139 M359P1E-ACCM-CAT 152 M322P1E-ACAM-CAG

114 para M434P1E-ACGM-CAA 127 para M181P1E-ACCM-CTT 140 M341P1E-ACCM-CAT 153 M285P1E-ACAM-CAG

115 para M376P1E-ACGM-CAA 128 M177P1E-ACCM-CTT 141 para M320P1E-ACCM-CAT 154 M268P1E-ACAM-CAG

116 M311P1E-ACGM-CAA 129 para M170P1E-ACCM-CTT 142 para M263P1E-ACCM-CAT 155 M244P1E-ACAM-CAG

117 M253P1E-ACGM-CAA 130 M155P1E-ACCM-CTT 143 M220P1E-ACCM-CAT 156 M192P1E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A1 Continuacioacutenhelliphelliphellip

Marcador Locus Marcador Locus Marcador Locus Marcador Locus

157 M174P1E-ACAM-CAG 170 M268P2E-ACCM-CAC 183 M155P2E-AGCM-CTT 196 M163P2E-ACAM-CAG

158 para M170P1E-ACAM-CAG 171 para M86P2E-AGGM-CAC 184 M280P2E-ACCM-CAT 197 M259P2E-AGCM-CAA

159 M160P1E-ACAM-CAG 172 M334P2E-ACCM-CAA 185 M239P2E-ACCM-CAT 198 M92P2E-ACCM-CAC

160 M153P1E-ACAM-CAG 173 M316P2E-ACCM-CAA 186 para M186P2E-ACCM-CAT 199 M75P2E-AGGM-CAC

161 M224P1E-AGCM-CAA 174 M282P2E-ACCM-CAA 187 M164P2E-ACCM-CAT 200 M325P2E-ACCM-CAA

162 M173P1E-AGCM-CAA 175 M251P2E-ACCM-CAA 188 M122P2E-ACCM-CAT 201 M96P2E-AGCM-CTT

163 M115P1E-AGCM-CAA 176 para M205P2E-ACCM-CAA 189 para M84P2E-ACCM-CAT 202 M294P2E-AGCM-CAT

164 para M98P1E-ACCM-CAC 177 M85P2E-ACCM-CAA 190 M442P2E-AGCM-CAT 203 M372P2E-ACCM-CAC

165 para M297P1E-ACCM-CTT 178 M380P2E-ACGM-CAA 191 M363P2E-AGCM-CAT 204 M340P2E-ACCM-CAA

166 M197P2E-AAGM-CAA 179 M372P2E-ACCM-CTT 192 M311P2E-AGCM-CAT 205 M242P2E-ACCM-CAA

167 M172P2E-AAGM-CAA 180 M217P2E-ACCM-CTT 193 para M226P2E-AGCM-CAT 206 M424P2E-AGCM-CAT

168 M100P2E-AAGM-CAA 181 M319P2E-AGCM-CTT 194 M301P2E-ACAM-CAG 207 M366P2E-AGCM-CAT

169 para M197P2E-AGCM-CAA 182 M193P2E-AGCM-CTT 195 M227P2E-ACAM-CAG 208 para M77P2E-ACAM-CAG

para Loci marcadores ligados al mapa geneacutetico

Cuadro A2 Medias de seis caracteres evaluados de las 133 liacuteneas F23 incluyendo los dos progenitores (girasol cultivado y silvestre) AP =

Altura de planta (m) NC = Nuacutemero de capiacutetulos DC = Diaacutemetro de capiacutetulos (cm) NA = Nuacutemero de aquenios PA = Peso de aquenios (g)

CA = Contenido de aceite de aquenios ()

Liacutenea AP NC DC NA PA CA

2 114 27 327 27 047 3492

7 115 12 355 8 018 3312

9 099 40 459 74 237 3197

11 114 87 133 5 007 3094

13 123 NA NA NA NA NA

22 105 58 365 8 010 3531

25 116 35 112 1 001 NA

27 146 10 791 49 166 3254

29 100 19 247 3 011 NA

32 070 12 260 11 025 2868

33 094 31 157 22 028 4044

42 127 19 175 3 006 NA

43 117 42 348 32 072 373

54 107 9 450 13 031 3056

59 110 22 200 6 009 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

60 122 51 NA NA NA NA

68 084 40 295 7 012 NA

69 114 46 125 1 001 NA

71 109 5 312 20 024 2285

74 077 6 408 43 053 NA

79 147 40 452 72 045 3093

83 123 19 317 2 005 NA

84 143 34 605 49 030 NA

87 109 26 252 6 004 NA

88 106 31 316 31 037 318

99 074 18 360 43 068 3676

102 137 90 293 24 036 3844

107 143 23 613 12 022 3331

109 142 51 442 25 049 3279

110 123 11 275 11 020 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

111 098 12 112 7 015 NA

112 118 21 175 7 011 NA

114 085 14 262 7 013 3307

117 092 10 354 17 043 3016

118 083 11 253 15 017 338

121 NA 1 112 5 010 NA

123 122 81 252 8 012 3399

125 104 31 301 12 024 3117

127 118 32 350 4 006 NA

130 155 13 463 84 249 2624

137 128 12 142 1 001 NA

138 091 22 135 3 005 NA

141 117 20 195 11 021 NA

145 123 18 437 27 049 2988

147 092 18 238 2 003 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

148 112 18 110 2 004 NA

169 151 48 425 16 036 2951

175 166 75 162 4 006 NA

178 075 12 142 5 009 373

180 097 13 474 32 088 3755

187 104 37 285 23 030 3534

188 133 57 354 30 053 3851

190 095 41 125 1 001 NA

192 113 20 337 59 125 378

194 100 20 359 32 084 3049

196 075 30 173 23 046 352

197 127 62 294 7 010 3225

198 093 28 486 27 047 3127

202 099 9 NA NA NA NA

203 072 17 130 1 026 3844

Cuadro A2 Continuacioacuten

Liacutenea AP NC DC NA PA CA

204 099 22 286 34 058 3829

209 126 51 325 9 017 3623

210 107 9 234 2 003 NA

211 120 65 NA 1 001 NA

216 089 6 197 5 009 NA

217 118 47 162 1 001 3911

218 108 38 265 5 011 3748

219 097 14 365 13 021 3279

226 124 8 733 17 053 3253

227 135 29 373 16 041 348

228 098 37 313 17 034 3056

229 074 22 305 19 017 3888

230 090 15 193 25 056 2598

234 100 33 119 3 004 NA

235 085 23 144 6 011 3296

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

237 080 19 343 23 035 NA

239 123 17 200 3 009 NA

246 116 5 253 12 047 3207

247 108 59 322 4 006 NA

250 082 28 248 30 055 3274

253 121 15 417 11 026 2222

255 103 23 353 35 144 3465

256 088 24 284 24 036 3417

258 096 28 361 45 076 3389

259 108 42 369 23 040 3515

260 104 8 322 47 093 3747

263 134 25 431 35 072 3474

264 097 57 299 6 008 3753

280 093 22 328 66 114 3338

281 088 10 137 1 001 NA

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

284 134 8 NA NA NA NA

286 067 19 293 24 034 2765

287 117 56 162 2 003 NA

289 114 50 383 8 023 399

291 172 44 323 17 022 2039

293 089 23 362 66 136 3264

295 098 6 NA 0 NA NA

299 106 28 268 17 032 3619

302 072 11 355 1 002 NA

303 130 21 NA 0 NA NA

309 098 10 184 38 073 431

313 123 42 162 1 001 NA

314 109 55 161 1 001 NA

316 112 NA 350 130 293 3564

317 107 18 423 7 021 3429

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

320 107 22 163 9 017 3301

321 118 31 287 11 020 3769

323 092 16 156 6 015 NA

326 070 21 279 17 031 3058

327 106 14 520 16 037 2199

328 115 30 269 8 010 2965

329 083 23 389 12 031 324

330 099 22 146 2 004 NA

333 121 12 536 11 026 354

338 085 17 259 7 013 NA

340 088 51 323 6 011 2513

342 066 10 294 4 008 NA

344 120 38 154 14 020 2158

351 093 59 357 6 011 NA

353 110 12 317 15 027 3432

Cuadro A2 Continuacioacutenhelliphelliphellip

Liacutenea AP NC DC NA PA CA

354 090 73 359 19 022 2888

355 091 22 157 1 001 NA

360 106 28 NA NA NA NA

361 127 20 439 51 121 3505

362 080 33 312 21 036 2428

363 107 21 295 6 011 3179

365 072 23 317 21 036 2016

367 117 27 454 21 046 NA

369 111 13 176 31 071 3459

370 079 17 323 2 002 NA

372 117 61 283 56 110 2835

373 117 97 180 19 026 2837

374 163 22 365 7 013 NA

Ac-8-2 121 405 134 2 001 NA

HA89 081 NA 506 93 434 4433

Page 16: Tesis Doctorado en Fitomejoramiento
Page 17: Tesis Doctorado en Fitomejoramiento
Page 18: Tesis Doctorado en Fitomejoramiento
Page 19: Tesis Doctorado en Fitomejoramiento
Page 20: Tesis Doctorado en Fitomejoramiento
Page 21: Tesis Doctorado en Fitomejoramiento
Page 22: Tesis Doctorado en Fitomejoramiento
Page 23: Tesis Doctorado en Fitomejoramiento
Page 24: Tesis Doctorado en Fitomejoramiento
Page 25: Tesis Doctorado en Fitomejoramiento
Page 26: Tesis Doctorado en Fitomejoramiento
Page 27: Tesis Doctorado en Fitomejoramiento
Page 28: Tesis Doctorado en Fitomejoramiento
Page 29: Tesis Doctorado en Fitomejoramiento
Page 30: Tesis Doctorado en Fitomejoramiento
Page 31: Tesis Doctorado en Fitomejoramiento
Page 32: Tesis Doctorado en Fitomejoramiento
Page 33: Tesis Doctorado en Fitomejoramiento
Page 34: Tesis Doctorado en Fitomejoramiento
Page 35: Tesis Doctorado en Fitomejoramiento
Page 36: Tesis Doctorado en Fitomejoramiento
Page 37: Tesis Doctorado en Fitomejoramiento
Page 38: Tesis Doctorado en Fitomejoramiento
Page 39: Tesis Doctorado en Fitomejoramiento
Page 40: Tesis Doctorado en Fitomejoramiento
Page 41: Tesis Doctorado en Fitomejoramiento
Page 42: Tesis Doctorado en Fitomejoramiento
Page 43: Tesis Doctorado en Fitomejoramiento
Page 44: Tesis Doctorado en Fitomejoramiento
Page 45: Tesis Doctorado en Fitomejoramiento
Page 46: Tesis Doctorado en Fitomejoramiento
Page 47: Tesis Doctorado en Fitomejoramiento
Page 48: Tesis Doctorado en Fitomejoramiento
Page 49: Tesis Doctorado en Fitomejoramiento
Page 50: Tesis Doctorado en Fitomejoramiento
Page 51: Tesis Doctorado en Fitomejoramiento
Page 52: Tesis Doctorado en Fitomejoramiento
Page 53: Tesis Doctorado en Fitomejoramiento
Page 54: Tesis Doctorado en Fitomejoramiento
Page 55: Tesis Doctorado en Fitomejoramiento
Page 56: Tesis Doctorado en Fitomejoramiento
Page 57: Tesis Doctorado en Fitomejoramiento
Page 58: Tesis Doctorado en Fitomejoramiento
Page 59: Tesis Doctorado en Fitomejoramiento
Page 60: Tesis Doctorado en Fitomejoramiento
Page 61: Tesis Doctorado en Fitomejoramiento
Page 62: Tesis Doctorado en Fitomejoramiento
Page 63: Tesis Doctorado en Fitomejoramiento
Page 64: Tesis Doctorado en Fitomejoramiento
Page 65: Tesis Doctorado en Fitomejoramiento
Page 66: Tesis Doctorado en Fitomejoramiento
Page 67: Tesis Doctorado en Fitomejoramiento
Page 68: Tesis Doctorado en Fitomejoramiento
Page 69: Tesis Doctorado en Fitomejoramiento
Page 70: Tesis Doctorado en Fitomejoramiento
Page 71: Tesis Doctorado en Fitomejoramiento
Page 72: Tesis Doctorado en Fitomejoramiento
Page 73: Tesis Doctorado en Fitomejoramiento
Page 74: Tesis Doctorado en Fitomejoramiento
Page 75: Tesis Doctorado en Fitomejoramiento
Page 76: Tesis Doctorado en Fitomejoramiento
Page 77: Tesis Doctorado en Fitomejoramiento
Page 78: Tesis Doctorado en Fitomejoramiento
Page 79: Tesis Doctorado en Fitomejoramiento
Page 80: Tesis Doctorado en Fitomejoramiento
Page 81: Tesis Doctorado en Fitomejoramiento
Page 82: Tesis Doctorado en Fitomejoramiento
Page 83: Tesis Doctorado en Fitomejoramiento
Page 84: Tesis Doctorado en Fitomejoramiento
Page 85: Tesis Doctorado en Fitomejoramiento
Page 86: Tesis Doctorado en Fitomejoramiento
Page 87: Tesis Doctorado en Fitomejoramiento
Page 88: Tesis Doctorado en Fitomejoramiento
Page 89: Tesis Doctorado en Fitomejoramiento
Page 90: Tesis Doctorado en Fitomejoramiento
Page 91: Tesis Doctorado en Fitomejoramiento
Page 92: Tesis Doctorado en Fitomejoramiento
Page 93: Tesis Doctorado en Fitomejoramiento
Page 94: Tesis Doctorado en Fitomejoramiento
Page 95: Tesis Doctorado en Fitomejoramiento
Page 96: Tesis Doctorado en Fitomejoramiento
Page 97: Tesis Doctorado en Fitomejoramiento
Page 98: Tesis Doctorado en Fitomejoramiento
Page 99: Tesis Doctorado en Fitomejoramiento
Page 100: Tesis Doctorado en Fitomejoramiento
Page 101: Tesis Doctorado en Fitomejoramiento
Page 102: Tesis Doctorado en Fitomejoramiento
Page 103: Tesis Doctorado en Fitomejoramiento