Medidas de la Diversidad Genética

207
Prólogo El módulo de aprendizaje, Análisis de la Diversidad Genética Utilizando Datos de Marcadores Moleculares, es el segundo de dos módulos de aprendizaje producidos con el propósito de promover la aplicación documentada de las técnicas moleculares en los estudios de diversidad biológica. Complementa el primer módulo, Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas: Módulo de Aprendizaje, y, del mismo modo, pretende difundir conocimientos acerca de tecnologías de marcadores moleculares para evaluar la diversidad genética, proveyendo así un fundamento para entender el análisis y la interpretación de datos más allá del uso recurrente de las tecnologías, solamente para estar de moda. Lo que motivó la producción de este módulo de aprendizaje fue un curso de capacitación sobre tecnologías moleculares organizado por el IPGRI y celebrado en China, donde participaron científicos de China, India, Indonesia, Malasia, Filipinas, Sri Lanka y Tailandia que trabajan con la diversidad genética de las frutas tropicales. Al finalizar el curso era obvio que la enseñanza de las técnicas había formado técnicos de laboratorio muy competentes. Sin embargo, si se va a formar a científicos competentes en el manejo y uso de los recursos genéticos, es necesario entonces proveer a los socios colaboradores del IPGRI con herramientas de análisis e interpretación de datos. El módulo de aprendizaje está especialmente dirigido a científicos interesados en evaluar la diversidad genética que cuentan con conocimientos básicos de biología y genética, conocen las tecnologías moleculares y necesitan orientación acerca de cómo abordar la planificación de experimentos y analizar e interpretar sus resultados. Los autores están convencidos de que los usuarios de estos módulos de aprendizaje encontrarán que la información brindada no solo es ilustrativa, sino también práctica, y que el uso de las tecnologías de marcadores moleculares puede ser un enfoque apasionante y viable para cualquier persona que planea hacer investigaciones sobre el análisis de la diversidad genética. Jan Engels Director Grupo de Ciencia y Tecnología de los Recursos Genéticos IPGRI

Transcript of Medidas de la Diversidad Genética

Page 1: Medidas de la Diversidad Genética

Prólogo El módulo de aprendizaje, Análisis de la Diversidad Genética Utilizando Datos de Marcadores Moleculares, es el segundo de dos módulos de aprendizaje producidos con el propósito de promover la aplicación documentada de las técnicas moleculares en los estudios de diversidad biológica. Complementa el primer módulo, Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas: Módulo de Aprendizaje, y, del mismo modo, pretende difundir conocimientos acerca de tecnologías de marcadores moleculares para evaluar la diversidad genética, proveyendo así un fundamento para entender el análisis y la interpretación de datos más allá del uso recurrente de las tecnologías, solamente para estar de moda. Lo que motivó la producción de este módulo de aprendizaje fue un curso de capacitación sobre tecnologías moleculares organizado por el IPGRI y celebrado en China, donde participaron científicos de China, India, Indonesia, Malasia, Filipinas, Sri Lanka y Tailandia que trabajan con la diversidad genética de las frutas tropicales. Al finalizar el curso era obvio que la enseñanza de las técnicas había formado técnicos de laboratorio muy competentes. Sin embargo, si se va a formar a científicos competentes en el manejo y uso de los recursos genéticos, es necesario entonces proveer a los socios colaboradores del IPGRI con herramientas de análisis e interpretación de datos. El módulo de aprendizaje está especialmente dirigido a científicos interesados en evaluar la diversidad genética que cuentan con conocimientos básicos de biología y genética, conocen las tecnologías moleculares y necesitan orientación acerca de cómo abordar la planificación de experimentos y analizar e interpretar sus resultados. Los autores están convencidos de que los usuarios de estos módulos de aprendizaje encontrarán que la información brindada no solo es ilustrativa, sino también práctica, y que el uso de las tecnologías de marcadores moleculares puede ser un enfoque apasionante y viable para cualquier persona que planea hacer investigaciones sobre el análisis de la diversidad genética. Jan Engels Director Grupo de Ciencia y Tecnología de los Recursos Genéticos IPGRI

Page 2: Medidas de la Diversidad Genética

Lo que usted debe saber sobre este módulo Cuando se planifican investigaciones, es decisivo que usted defina acertadamente las preguntas que va a abordar, incluso si surgen otras preguntas en el transcurso de la investigación y usted quiera hacer cambios en el plan original, a medida que avance. También debe conocer algunos de los principios para establecer experimentos para garantizar que los resultados sean convincentes. En el contexto de su trabajo con recursos genéticos, necesita conocer los fundamentos de la diversidad genética y las herramientas disponibles para examinar sus datos; así, puede interpretarlos correctamente. A continuación, se enumeran algunos de los conceptos y las herramientas que tratamos:

x Estrategias de muestreo x Fundamentos de la genética poblacional x Las medidas matemáticas utilizadas para describir la diversidad genética,

los índices de distancia genética y los métodos empleados para expresar el grado de afinidad entre muestras

x Programas de computador y recursos de Internet disponibles Los cálculos incluidos en los conceptos clave de la genética poblacional, las medidas de diversidad genética, los índices y los métodos de agrupación se ilustran con ejemplos que fueron preparados precisamente para esta publicación. Así, el usuario puede ver de inmediato cómo se aplican las expresiones matemáticas. Además, deseamos mostrar que, aunque estos cálculos casi siempre se realizan con la ayuda de un programa de computador, la mayoría puede realizarse manualmente. Aunque se utilice un programa de computador, consideramos que el científico debe entender lo que hace el computador y así desarrollar sus propios criterios para decidir qué método utilizar. Este módulo de aprendizaje está destinado a ayudar a quienes quieren analizar la diversidad genética con la ayuda de datos moleculares. Como tal, no constituye una herramienta integral para aprender sobre la genética poblacional o para enseñar esta materia. No obstante, hemos enumerado referencias bibliográficas que apoyan las nociones importantes de la genética poblacional, respaldan las expresiones matemáticas y brindan un mejor entendimiento acerca de la manera de aplicar los métodos en situaciones de investigación de la vida real. La idea es que el módulo de aprendizaje pueda seguirse como una herramienta independiente, aunque esperamos que también pueda usarse como una guía en la instrucción universitaria básica. Sin embargo, los usuarios de este módulo deben tener conocimientos básicos de genética o haber completado con anterioridad el primer módulo sobre Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas: Módulo de Aprendizaje. En consecuencia, si usted no está familiarizado con las tecnologías de marcadores moleculares, le recomendamos enfáticamente que empiece su capacitación dedicándose al primer módulo mencionado anteriormente. Una vez que haya entendido los principios básicos de estas técnicas, entonces puede continuar con el segundo módulo, teniendo unos fundamentos más sólidos para entender los algoritmos matemáticos.

Page 3: Medidas de la Diversidad Genética

El módulo de aprendizaje ha sido organizado en submódulos complementarios e independientes, para que el usuario pueda escoger la sección que le interese en cualquier momento. En algunos casos, hemos suministrado información adicional, en forma de apéndices, para no complicar lo esencial, proveyendo expresiones matemáticas adicionales o ejemplos para quienes los pueden encontrar útiles para un entendimiento cabal. Este módulo de aprendizaje está diseñado de tal manera que pueden utilizarse solamente las diapositivas en formato de presentación o las diapositivas y las notas acompañantes juntas. El módulo puede emplearse para la enseñanza y preparación de clases o para facilitar el proceso de aprendizaje, en particular para ayudar a los estudiantes, especialmente de pregrado, a entender cómo se eligen entre las técnicas moleculares aplicadas en los estudios de diversidad genética y aplicarlas en sus proyectos de investigación. También puede emplearse como una guía de referencia al trabajar con profesionales que necesitan aplicar técnicas moleculares, métodos estadísticos y análisis de datos requeridos para llevar a cabo sus investigaciones. Para nosotros, es de suma importancia obtener información de retorno acerca de esta publicación. Estamos convencidos de que siempre puede mejorarse. Para dar una respuesta eficaz a nuestros socios colaboradores y atender las necesidades de otros usuarios, apreciaríamos mucho su opinión sobre la organización, el contenido y la utilidad del módulo. Puede escribirnos a: M. Carmen de Vicente César López International Plant Genetic Resources Institute (IPGRI)

Universidad Nacional Agraria La Molina Av. La Universidad s/n. Apdo. 456 Lima 12

Via dei Tre Denari 472/a Lima, Perú 00057 Maccarese (Fiumicino) Correo electrónico: [email protected] Roma, Italia Correo electrónico: [email protected]

Theresa Fulton

Institute for Genomic Diversity 130 Biotechnology Building Cornell University Ithaca, New York 14583 Correo electrónico: [email protected] Esperamos sinceramente que este módulo complemente el módulo anterior, Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas: Módulo de Aprendizaje, y que, juntos, los dos módulos de aprendizaje ofrezcan a nuestros socios colaboradores, especialmente los de los países en desarrollo cuyo acceso a la tecnología de vanguardia y a la literatura o instrucción científica integral es limitado, una oportunidad para hacer investigación avanzada en el campo de la diversidad genética de plantas. De este modo, los módulos harán un aporte al conocimiento global de estos recursos tan valiosos. M. Carmen de Vicente César López Theresa Fulton IPGRI Univ. La Molina IGD, Cornell University

Page 4: Medidas de la Diversidad Genética

Objetivos del módulo En relación con los usuarios del módulo, nuestras metas son las siguientes:

x Que comprendan los conceptos científicos de la diversidad genética a través de los principios básicos de la genética poblacional

x Que se familiaricen con las expresiones matemáticas utilizadas para

describir la diversidad genética y que sean capaces de realizar cálculos imprescindibles con base en los datos de marcadores moleculares

x Que adquieran los conocimientos básicos para aplicar tecnologías

moleculares en la evaluación de la diversidad genética y para interpretar, en la debida forma, los datos moleculares

Page 5: Medidas de la Diversidad Genética

1

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 1

Análisis de la diversidad genética utilizando datos de marcadores moleculares:

Módulo de aprendizaje

Introducción

Page 6: Medidas de la Diversidad Genética

2

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 2

f El método científico• Definición de la pregunta biológica• Formulación de la hipótesis y del diseño

experimental� Muestreo del material vegetal� Muestreo del genoma

• Conducción de los experimentos• Análisis e interpretación de los datos

f Niveles de la diversidad biológicaf Medición de la variación genéticaf Relaciones entre el fenotipo y el genotipo

Contenido

Page 7: Medidas de la Diversidad Genética

3

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 3

f Definición de la pregunta biológica

f Formulación de la hipótesis y del diseño experimental

f Conducción de los experimentos

f Análisis e interpretación de los datos

El método científico

El método científico comienza con la definición de una pregunta biológica; es decir, la razón por la cual se quiere realizar la investigación. Después de esta primera fase, comienza un proceso repetitivo en el cual se siguen diversos pasos que llevan hacia el análisis de resultados. Este proceso puede realizarse varias veces antes de que se obtengan los resultados finales. Los resultados deben proporcionar evidencia que prueben o rechacen la hipótesis que respaldó el diseño del experimento. Si se prueba la hipótesis, entonces se ha obtenido una respuesta satisfactoria a la pregunta inicial. Si la hipótesis es rechazada, entonces debe formularse una nueva hipótesis y diseñarse otro experimento. Todo el proceso comienza de nuevo, y asísucesivamente y en forma reiterada hasta que se obtenga una interpretación satisfactoria.

A veces, cuando el interés de la investigación está enfocado hacia la evaluación de la diversidad genética, la pregunta inicial se reemplaza con una descripción. En este caso, no existe propiamente una hipótesis y el experimento se diseña para recopilar la información que evaluará la variación existente.

En las siguientes diapositivas, se tratan cada uno de los pasos mencionados anteriormente.

Page 8: Medidas de la Diversidad Genética

4

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 4

f ¿Cuál es el problema?

f Recopilación de información de avanzada sobre el tema:

• ¿El problema ya ha sido estudiado?• ¿Existe una explicación?

Definición de la pregunta biológica

El primer paso consiste en definir la pregunta biológica detrás de nuestro interés de investigación. Podemos buscar una respuesta a una pregunta o una descripción. En los estudios de diversidad genética, casi siempre comenzamos buscando una descripción; por ejemplo, ¿Cuánta variación existe? ¿Cómo está organizada esa variación? Lo más probable es que los resultados que obtengamos nos lleven, con el tiempo, a formularnos preguntas, las cuales ya estaban implícitas en el análisis descriptivo.

La búsqueda de bibliografía pertinente nos ayudará no sólo a definir nuestro tema de interés, sino también a recopilar información en un contexto más amplio y, en consecuencia, identificar información clave para las hipótesis que posiblemente tendremos que proponer.

Page 9: Medidas de la Diversidad Genética

5

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 5

Formular preguntas sobre:• Estrategias de conservación• Uso para el mejoramiento de cultivos• Evolución y domesticación

¿Qué clase de preguntas?

Como se mencionó anteriormente, muchas preguntas pueden llevar a que sea necesario hacer investigación. Algunos ejemplos de preguntas son aquellas:

• Relacionadas con la conservación:¿Cómo está representada la diversidad de un recurso genético en la naturaleza y en las colecciones?¿Cuáles son las prioridades para la conservación?Si usamos solamente recursos finitos, ¿cómo garantizamos el futuro?¿De qué manera podemos cuantificar la diversidad actual para que sirva de referencia futura para estudios sobre erosión genética?¿Existe un modelo de distribución que pueda ser empleado para orientar nuestras actividades de colección?¿Podemos garantizar que nuestras muestras son diferentes?¿Estas muestras, aparentemente diferentes, pertenecen a diferentes taxa?

• Relacionadas con el mejoramiento de cultivos:¿De qué manera se puede utilizar nuestra muestra para apoyar el mejoramiento de cultivos?¿Estos recursos genéticos son fuentes potenciales de diversidad alélica?¿Son fuentes aceptables de caracteres agronómicos deseables?

• Relacionadas con la evolución:¿Dónde se originó el cultivo?¿Cuál es el progenitor de un cultivo específico?¿Se ha presentando introgresión entre las muestras poblacionales de diferentes orígenes?

Page 10: Medidas de la Diversidad Genética

6

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 6

I3 I3

I2 I2

6

I

etc.

I1 I3

I1 I2

I1 I1

I3

I2

I1

I

H1 H1G2 G3F2 F2E1 E3D1 D1C1 C1B1 B2A1 A1Otro individuo

H1 H1G1 G3F1 F1E2 E4D1 D1C2 C3B2 B2A1 A2Un individuo583201 6 3 10 1 6 3 3 Genotipos (no.)

HGFEDCBALoci6K(K + 1)/2Número total de genotipos

etc.etc.etc.

G1 G3F2 F2E1 E3C1 C3B2 B2A2 A2

G1 G2F1 F2E1 E2C1 C2B1 B2A1 A2

H1 H1G1 G1F1 F1E1 E1D1 D1C1 C1B1 B1A1 A1Genotipo���E4����

�G3�E3�C3��

�G2F2E2�C2B2A2

H1G1F1E1D1C1B1A1AleloHGFEDCBALoci

Un ejemplo de dos preguntas:¿Cuánta variación hay?¿Qué proporción nos podemos dar el lujo de perder?

¿Cuánta variación hay? y ¿Qué proporción nos podemos dar el lujo de perder?

Estas dos preguntas son ejemplos de lo que podemos preguntar para explicar la cantidad de variación presente en una muestra y, como resultado, calcular la cantidad de variación que podríamos perder. La diapositiva muestra una situación simplificada de un organismo para el cual analizamos 9 loci, cada uno con un número diferente de alelos en la muestra (los loci A y B tienen 2 alelos cada uno, el locus C tiene 3 alelos, el locus D solamente 1 alelo, y así sucesivamente). La segunda parte del cuadro muestra los genotipos para cada locus: A1 A1, A1 A2, A2 A2, B1 B1 , y asísucesivamente.

Se da el cálculo para el número total de genotipos por locus, donde K = el número de alelos por locus. Para cada locus, se calcula el número de genotipos (p. ej., locus A = 3, locus B = 3, locus C = 6, locus D = 1, ...). Luego, se calcula el número total de genotipos posibles en este organismo con base en estos 9 loci (3 x 3 x 6 x 1 x 10 x 3 x 6 x 1 x 6 = 58,320 genotipos).

En las dos últimas hileras del cuadro, se muestran 2 genotipos de los 58,320 posibles. En una estrategia de conservación, si se seleccionaran solamente 2 genotipos al azar, se perdería un alto porcentaje de la variación genética.

Page 11: Medidas de la Diversidad Genética

7

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 7

f ¿De qué manera se puede enfocar mejor la pregunta?

f ¿Existen estrategias alternativas?

f Consideraciones de costo, tiempo y recursos disponibles

f Estrategias de muestreo• Poblaciones versus individuos• Genoma

Formulación de la hipótesis y del diseño experimental

Una hipótesis acertada es una suposición acerca de una observación y debe ser susceptible de ser validada experimentalmente, lo que sirve después para formular conclusiones generales. Para formular una hipótesis acertada en estudios de diversidad genética se requiere tener conocimientos básicos en varios campos; a saber, sistemas de reproducción, distribución espacial y temporal, e interacciones interespecíficas. Por ejemplo, si queremos analizar una especie que se reproduce mayormente por autopolinización, nuestra hipótesis puede basarse en el hecho de que la especie tendrá un polimorfismo bajo dentro de la población y un polimorfismo alto entre una población y otra. O, si los individuos de una especie dada se encuentran ampliamente difundidos en una región, nuestra hipótesis puede suponer que las poblaciones en esa región tendrán frecuencias alélicas similares.

Una vez definida la pregunta inicial, la hipótesis nos ayudará a diseñar el experimento. Normalmente, pueden existir varias estrategias experimentales. La estrategia elegida finalmente dependerá de los recursos disponibles; es decir, la infraestructura, los conocimientos, el tiempo y los recursos económicos. También es de vital importancia considerar las estrategias de muestreo: (1) hacer un muestreo de individuos en nuestras poblaciones seleccionadas y (2) hacer un muestreo del genoma. En los estudios con marcadores moleculares, hacer un muestreo del genoma significa tomar una decisión respecto al número de puntos a lo largo de las cadenas de ADN (secuencia del ADN o cromosomas) para garantizar un conjunto de datos que responda satisfactoriamente a nuestra pregunta original (es decir, ¿cuánta precisión necesitamos?).

A continuación, trataremos el muestreo en más detalle.

Si desea obtener más información acerca de algunos de estos temas, remítase al módulo de aprendizaje Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas (clic aquí).

Page 12: Medidas de la Diversidad Genética

8

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 8

f ¿Cuántas poblaciones o individuos, o ambos, necesitamos para alcanzar el objetivo de nuestra investigación?

f ¿Es realista el objetivo de nuestra investigación?

Muestreo del material vegetal

Cada enfoque hacia la medición de la variación dentro de poblaciones y su estructura dentro de las mismas hace que sea necesario decidir acerca de una estrategia de muestreo específica y óptima.

Existen dos criterios principales que ayudan a identificar el procedimiento óptimo de muestreo, independientemente de la pregunta de investigación que se está abordando (Brown y Weir 1983): (1) la estrategia de elección puede considerarse óptima si la variación del muestreo se minimiza por unidad de experimentación; y (2) la facilidad de operación y los recursos disponibles.

Aunque no existe una publicación integral que trate aspectos pertinentes a todas las situaciones, sí se pueden encontrar en la literatura tratados sobre algunas de ellas. Por ejemplo, en Brown y Weir (1983) se encuentra información sobre la toma de muestras para calcular la frecuencia de alelos, el número de alelos por locus y la diversidad de genes. Ellos, a su vez, mencionan literatura básica que puede ser pertinente al tema. Otro ejemplo, Gregorius (1980) expresa ideas acerca de los procedimientos de muestreo y presenta un cuadro para calcular los tamaños mínimos de la muestra necesarios para garantizar que se detecten, con una probabilidad dada, todos los alelos con frecuencias superiores a un umbral definido.

No obstante, en todos los casos será importante evaluar y confrontar los resultados concebidos de la investigación contra los recursos disponibles. Si desea obtener más información, remítase a la sección Consideraciones Finales del módulo de capacitación Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas (clic aquí).Referencias

Brown, A.H.D. y B.S. Weir. 1983. Measuring genetic variability in plant populations. Pp. 219-239 en Isozymes in Plant Genetics and Breeding, part A (S.D. Tanksley y T.J. Orton, eds.). Elsevier Science Publishers, Amsterdam.

Gregorius, H.R. 1980. The probability of losing an allele when diploid genotypes are sampled. Biometrics 36:643-652.

Page 13: Medidas de la Diversidad Genética

9

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 9

f ¿Cuántos loci deben analizarse?f Son posibles dos estrategias:

• Seleccionar unos pocos marcadores que proporcionen mucha información

• Seleccionar numerosos marcadores que no brinden mucha información, distribuidos al azar dentro del genoma

Muestreo del genoma

Para muestrear el genoma, lo ideal sería hacerlo conociendo la distribución del polimorfismo genético dentro del genoma. Sin embargo, por lo general no se dispone de conocimientos a priori sobre la distribución del polimorfismo. En consecuencia, los estudios se realizan irreflexivamente reproduciendo experimentos similares que ya han sido publicados, o con base en simulaciones. En todos los casos, es importante comparar las ventajas y desventajas de los diferentes tipos de marcadores porque tienen distribuciones característicamente diferentes dentro del genoma.

Mariette et al. (1999) presentan los resultados de la simulación de un experimento en el cual se analizó la influencia de dos tipos de marcadores con diferentes números de loci: (1) un experimento de AFLP con 200 loci registrados como datos dominantes o codominantes, y (2) un experimento de microsatélites con dos situaciones diferentes —una con 5 loci y otra con 50 loci. Los resultados se presentaron en una gráfica que muestra una compensación entre el número de loci analizados y la cantidad de información obtenida y su precisión. En la gráfica se observa que tanto el número como el contenido de la información (herencia dominante versus codominante) del tipo de marcador utilizado son importantes para garantizar el muestreo adecuado del genoma.

Referencia

Mariette, S., V. Lecorre y A. Kremer. 1999. Sampling within the genome for measuring within-population diversity: Trade-offs between markers en Sampling Strategies for Marker Analysis. A compendium of the research project Development, Optimization and Validation of Molecular Tools for the Assessment of Biodiversity in Forest Trees as part of the European Union DGXII Biotechnology FW IV Research Programme Molecular Tools for Biodiversity. (E.M. Gillet, ed.). <http://webdoc.sub.gwdg.de/ebook/y/1999/whichmarker/index.htm>

Page 14: Medidas de la Diversidad Genética

10

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 10

1. Si la muestra es demasiado pequeña, obtenemos cálculos sesgados de frecuencias de alelos

0.5350.465343927100

0.50350.49653063952991000

0.5

0.6

0.25

q

0.5

0.4

0.75

pFrecuencia de alelosGenotipos

300,000400,000300,0001,000,000

1016430

21710

A2 A2A1 A2A1 A1Indivs. (no.)

Problemas originados por realizar un muestreo deficiente

(continúa en la siguiente)

El cuadro arriba muestra un ejemplo donde se calculan las frecuencias de alelos para muestras de números crecientes de individuos respecto a un solo gen (A) con dos alelos. A medida que aumenta el tamaño de la muestra, mayor será la oportunidad de que todos los genotipos tengan una representación similar. En consecuencia, el cálculo de frecuencias de alelos se acerca más a la situación real y las conclusiones del experimento son más confiables.

Page 15: Medidas de la Diversidad Genética

11

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 11

2. Algunos alelos quedan fuera del muestreo, de manera que se califican como ausentes:

Población inicialFrecuencia de A1 (p) = 25/96 = 0.260 Frecuencia de A2 (q) = 68/96 = 0.708 Frecuencia de A3 (s) = 3/96 = 0.031

MuestraFrecuencia de A1 (p) = 8/36 = 0.222Frecuencia de A2 (q) = 28/36 = 0.778 Frecuencia de A3 (s) = 0/36 = 0.000 (perdido)

n = 48

A1A2A1A1

A2A2

A2A2

A2A2 A2A2 A2A2A2A2 A2A2

A2A2

A2A2

A1A2 A1A2

A1A2 A1A2

A1A2

A1A2

A1A2A1A1

A1A1

A1A1A1A1 A1A1

A1A1

A1A1

A2A2

A2A2

A2A2

A2A2

A2A2

A2A2

A2A2

A2A2

A2A2

A1A3

A2A2

A2A2

A2A2

A2A2

A2A3

A2A2

A2A2

A2A2

A2A2

A2A2

A2A3

A2A2

A2A2n = 18

A2A2

A2A2A2A2 A2A2

A2A2

A2A2

A1A2 A1A2

A1A2

A1A2 A1A1

A1A1

A2A2

A2A2A2A2

A2A2 A2A2

A2A2

Problemas originados por realizar un muestreo deficiente (continuación)

El ejemplo anterior muestra una situación en la cual se toma una submuestra de una población de tal manera que se omite el alelo A3, presente en la población original. La submuestra no contiene todos los alelos y, por consiguiente, no es representativa de la población más amplia. La descripción de la diversidad genética de la muestra más pequeña, como un estimador de la población más grande, no será equivalente o legítima.

Page 16: Medidas de la Diversidad Genética

12

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 12

f Utilice las herramientas apropiadas para probar la hipótesis

f Incluya medidas de control de calidad para el experimento y para la recopilación de datos

Conducción de los experimentos

Al establecer un experimento, un investigador debe tener en cuenta que las herramientas moleculares pueden dar mayor profundidad a los estudios de diversidad ya que proporcionan un escenario común para medir y analizar la diversidad. Sin embargo, los datos moleculares casi siempre son complementarios a otros datos de caracterización (por ejemplo, morfología, patología) y el análisis combinado de estos datos puede ofrecer un escenario más integral para la interpretación.

Al seleccionar las tecnologías moleculares, se debe prestar atención a los siguientes aspectos:

• Su potencial para responder a la pregunta biológica

• Opciones para el muestreo del genoma

• Tipo y calidad del material vegetal disponible

• Medidas posibles para garantizar la calidad de los datos

• Medidas para garantizar la reproducibilidad

• Conocimientos requeridos para la recopilación de datos

Si desea obtener más detalles acerca de los temas mencionados anteriormente, remítase al módulo de aprendizaje Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas (clic aquí).

Page 17: Medidas de la Diversidad Genética

13

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 13

f ¿Los datos apoyan la hipótesis?

f ¿Qué herramientas analíticas debemos emplear?

f Lo que también necesitamos:• Conceptos científicos detrás de la noción de

diversidad, p. ej.:� Niveles de diversidad biológica� Variación entre y variación dentro � Relaciones entre el fenotipo y el genotipo

• Conceptos básicos de genética poblacional

Análisis e interpretación de los datos

Una vez se hayan recopilado los datos, el siguiente paso del experimento es el análisis. Nótese que los resultados se basan en una muestra dada; es decir, los valores obtenidos solamente serán estimadores de los parámetros de población.

Hoy en día, se dispone de diferentes herramientas analíticas, así como de diferentes programas de computador. Estos se discutirán en las dos últimas secciones de este módulo. Simultáneamente, necesitamos conocer los conceptos científicos básicos detrás de la diversidad genética y la genética poblacional (que es aquella parte de la genética que trata sobre la variación genética). Las diapositivas y la sección que aparecen a continuación presentan un resumen de estos temas.

Page 18: Medidas de la Diversidad Genética

14

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 14

1. Diversidad dentro de una población (= diversidad genética)

2. Diversidad de especies

3. Diversidad de ecosistemas

Niveles de diversidad biológica

La diversidad biológica puede dividirse en categorías que describen diferentes aspectos de los sistemas vivos, que los científicos miden de diferentes maneras.

Hoy en día resulta ser una práctica común definir la diversidad biológica en función de los genes (diversidad dentro de una población o diversidad genética), las especies y los ecosistemas, los cuales corresponden a tres niveles fundamentales de la organización biológica y están jerárquicamente relacionados.

La ‘diversidad genética’ se refiere a la variación de los genes dentro de la especie; es decir, a la mezcla de genes contenidos dentro de los individuos. Esto abarca poblaciones diferenciadas de la misma especie o la variación genética dentro de una población. En último término, la diversidad genética radica en los cambios en la secuencia de los cuatro pares de bases del ADN que conforman el código genético. Las mutaciones de genes y cromosomas generan nueva variación genética, la cual se propaga por recombinación en los microorganismos cuya reproducción es sexual. Otros tipos de diversidad genética pueden ser causados por la cantidad de ADN por célula, o por variantes en la estructura y el número de cromosomas. La selección actúa en el acervo de variación genética actual y, en consecuencia, facilita la evolución y el mejoramiento selectivo artificial. La diversidad genética hace posible que las poblaciones se adapten a condiciones cambiantes del medio ambiente.

Por lo general, el nivel de especie se considera como el nivel más natural para considerar la diversidad de todo el organismo. Las especies también son el foco primario de la evolución, y el origen y la extinción de especies son los principales agentes de la diversidad biológica en casi todos los sentidos. La diversidad a nivel de especie puede medirse de diversas maneras. La ‘riqueza de especies’ es el número de especies en una región. La ‘diversidad taxonómica’también mide la relación de las especies entre sí.

La definición y clasificación de los ecosistemas son inexactas, porque sus límites son imprecisos. Por tanto, en la práctica, es difícil evaluar la diversidad de los ecosistemas a otro nivel que no sea local o regional y luego sobre todo en función de la vegetación. Los ecosistemas son diferentes de los genes y las especies no sólo por su composición (incluyen componentes abióticos y están determinados, en parte, por los suelos y el clima), sino también por su estructura y función.

Page 19: Medidas de la Diversidad Genética

15

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 15

f La variación o polimorfismo puede ser evaluado a diferentes niveles de organización

f La distribución de polimorfismo se observa para diferentes niveles jerárquicos dentro de la organización (áreas, regiones, poblaciones, subpoblaciones, individuos)

Medición de la variación genética

Área 1

Población 1

Región 1 Región 2 Región 3

Población j

Población k

Población u

Población tPoblación i

Población s

Individuo

Población 2

Población 3

Se encuentran diferencias genéticas entre individuos dentro de una población, y también en las frecuencias alélicas entre poblaciones. En total, la cantidad relativa de variación depende de la especie, la historia y el medio ambiente.

La presencia de variantes (polimorfismo) en una muestra puede ser evaluada en función de sus genotipos, alelos, haplotipos o nucleótidos. Las muestras pueden dividirse jerárquicamente a nivel de especie, población o dentro de la población. El tamaño del muestreo debe ser suficiente cuando la meta es estudiar la variación genética (diapositivas anteriores). Las estrategias de muestreo y el tamaño de las muestras pueden depender de la organización de las especies:

• Pocos individuos (una especie recién introducida)

• Numerosos individuos introducidos

• Individuos de diferente origen geográfico

Page 20: Medidas de la Diversidad Genética

16

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 16

• Fenotipo– Específico de los caracteres

• Marcadores moleculares– Diversidad neutral– ADN o proteína

• Secuencia del ADN– Diversidad alélica

• Expresión– Nivel de ARN

A1

Cromosoma ADN ARN POLIPÉPTIDO (enzima Į1)

OH

O

Precursor del pigmento

Pigmento rojo

A1

Genotipo Fenotipo

Relaciones entre el fenotipo y el genotipo

El análisis de la variación genética con tecnologías moleculares suministra información a nivel del ADN. Puede ser diversidad neutral, identificada a lo largo de la secuencia del ADN en las regiones cuya función se desconoce, como cuando utilizamos tipos anónimos de marcadores (por ejemplo, AFLP, RAPD). O, la diversidad puede basarse en genes conocidos, es decir, dentro de las regiones de codificación de la secuencia del ADN. Esta diversidad afecta la expresión de estos genes y, en consecuencia, al ARN —el ácido nucleico encargado de traducir en proteínas la información del código genético. Las proteínas, a su vez, son los elementos que conforman la estructura de los organismos, lo que significa que son responsables de lo que vemos, el fenotipo. En consecuencia, el genotipo y el fenotipo están estrechamente asociados. También pueden usarse las medidas fenotípicas de diversidad y, a veces, si se toman en la forma correcta, pueden reflejar la constitución molecular de un individuo dado.

Page 21: Medidas de la Diversidad Genética

17

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 17

f Para hacer investigación sobre la diversidad genética se debe seguir el método científico

f Para evaluar la diversidad genética debe definirse la pregunta biológica que se va a abordar

f Es necesario seguir unas pautas determinadas cuando se hace el muestreo, no sólo de individuos y dentro de poblaciones, sino también del genoma

f La interpretación de los resultados implica tener conocimientos básicos de los conceptos detrás de la diversidad biológica y la genética poblacional

En resumen

Page 22: Medidas de la Diversidad Genética

18

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 18

f Los pasos esenciales para establecer un experimento

f La importancia que tiene para su investigación la identificación de la pregunta clave

f Los puntos principales que debe considerar al hacer el muestreo

f Los conceptos básicos detrás de la noción de diversidad genética

Hasta el momento, usted debería saber …

Page 23: Medidas de la Diversidad Genética

ReferenciasBrown,  A.H.D.  y  B.S.  Weir.  1983.  Measuring  genetic  variability  in  plant  populations.  

Pp.  219-­239  en Isozymes in  Plant  Genetics  and  Breeding,  part  A  (S.D.  Tanksleyy  T.J.  Orton,  eds.).  Elsevier  Science  Publishers,  Amsterdam.  

de  Vicente,  M.C.  y  T.  Fulton  (eds.).  2004.  Tecnologías de  Marcadores Molecularespara Estudios de  Diversidad Genética de  Plantas:  Módulo de  Aprendizaje.  Instituto Internacional de  Recursos Fitogenéticos (IPGRI)  Roma,  Italia.  

Gregorius,  H.R.  1980.  The  probability  of  losing  an  allele  when  diploid  genotypes  are  sampled.  Biometrics  36:643-­652.

Mariette,  S.,  V.  Lecorre y  A.  Kremer.  1999.  Sampling  within  the  genome  for  measuring  within-­population  diversity:  Trade-­offs  between  markers  en Sampling  Strategies  for  Marker  Analysis.  A  compendium  of  the  research  project  Development,  Optimization  and  Validation  of  Molecular  Tools  for  the  

Assessment  of  Biodiversity  in  Forest  Trees as  part  of  the  European  Union  DGXII  Biotechnology  FW  IV  Research  ProgrammeMolecular  Tools  for  Biodiversity.(E.M.  Gillet,  ed.).  <http://webdoc.sub.gwdg.de/ebook/y/1999/whichmarker/index.htm>

(Clic  aqui)

Page 24: Medidas de la Diversidad Genética

20

Derechos de Autor: IPGRI y Cornell University, 2004 Introducción 20

f Conceptos básicos de genética poblacional

f Medida de la diversidad genética

f Programas informáticos para el análisis de la diversidad genética

f Glosario

A continuación

Page 25: Medidas de la Diversidad Genética

1

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 1

Conceptos básicos de genética de poblaciones

Análisis de la diversidad genética utilizando datos de marcadores moleculares:

Módulo de aprendizaje

Page 26: Medidas de la Diversidad Genética

2

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 2

f Definiciones

f El principio de Hardy-Weinberg

f Ejemplos del cálculo de la frecuencia alélica

f Sistemas de reproducción y apareamiento

f Factores que determinan la diversidad genética

f Apéndice 1: Valores críticos de la distribución Chi-cuadrado

Contenido

Page 27: Medidas de la Diversidad Genética

3

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 3

f Cuantificación de la variabilidad mediante la descripción de los cambios en la frecuencia alélica, a través del tiempo, respecto a un carácter en particular

f Análisis de las causas que conducen a esos cambios

Definiciones: Genética de poblaciones

Hay muchas formas de definir la ‘genética de poblaciones’. En general, la genética de poblaciones es el estudio de la aplicación de las leyes de Mendel y otros principios genéticos a poblaciones completas de organismos en vez de aplicarlas solamente a individuos. La genética de poblaciones es también el estudio de los cambios en las frecuencias génicas y, como tal, se relaciona estrechamente con la genética evolutiva porque la evolución depende, en gran medida, de los cambios en las frecuencias génicas. En las diapositivas 33 a 42 de esta sección se encuentra una breve introducción a los principales factores que pueden causar cambios en la diversidad genética.

Aunque resulta prácticamente imposible inspeccionar todas las variables genéticas presentes en una población, se puede examinar una población a través de la variación de fenotipos individuales (descripción de ciertos rasgos morfológicos y fisiológicos) o de sus genotipos (marcadores moleculares).

Page 28: Medidas de la Diversidad Genética

4

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 4

f La descripción de todos los caracteres de un individuo respecto a su morfología, fisiología, relaciones ecológicas y comportamiento

f En un momento dado, el fenotipo es el resultado de la interacción de los genes del individuo con el entorno

Fenotipo es …

Las diferencias fenotípicas pueden ser cualitativas (presentes o ausentes) o cuantitativas. Los caracteres cualitativos pueden ser clasificados y los caracteres cuantitativos son medidos.

Si los individuos se parecen entre sí, comparten el mismo fenotipo. Algunos genotipos pueden tener el mismo fenotipo. Es importante distinguir entre genotipo y fenotipo en aquellos caracteres que son modificados por el entorno: dos individuos con el mismo genotipo pueden resultar en diferentes fenotipos debido a la influencia del ambiente.

Page 29: Medidas de la Diversidad Genética

5

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 5

Rosado Crema pálido

Rosado oscuro

BlancoAzul claroPúrpura

Crema oscuroAmarillo Rojo

Variación fenotípica

Las poblaciones naturales son fenotípicamente diversas. La riqueza de diversidad fenotípica es extraordinaria y evidente, incluso en una observación espontánea.

Una población de individuos estrechamente relacionados entre sí mostrará una variabilidad baja. Esta situación es especialmente crítica si las condiciones ambientales cambian y esa población no cuenta con la variación necesaria para hacer frente al cambio. La población rápidamente podría enfrentarse a la extinción.

La genética de poblaciones trata la diversidad fenotípica, especialmente cuando esta diversidad se debe a las diferencias en la composición genotípica de los individuos.

Page 30: Medidas de la Diversidad Genética

6

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 6

f Un gen es la unidad básica, tanto física como funcional, de la herencia, y transmite información de una generación a la siguiente

f Un alelo es cualquiera de las formas alternas de un gen que puede existir en un locus

Gen y alelo

No toda la secuencia de ADN está constituida por genes. Los genes son aquellas secciones del ADN cuya función se conoce. Incluyen una sección transcrita y un elemento regulador que permite su transcripción. La existencia de genes se deduce al observar la segregación de las variantes en la descendencia de los cruzamientos, producidos ya sea de manera natural o artificial. Esta observación fue la base sobre la cual Gregor Mendel definió las leyes de la herencia a finales del siglo XIX.

Los genes pueden tener dos alelos o más. En realidad, un gen puede tener tantos alelos como para dar origen a una serie alélica para ese gen. Los alelos que pertenecen a una serie pueden mostrar diferentes patrones de dominancia entre sí. Por ejemplo, un alelo puede mostrar un efecto dominante, lo que significa que expresa su fenotipo aunque esté acompañado de un alelo recesivo. Un alelo recesivo es aquel cuyo fenotipo no se expresa en un individuo heterocigoto. Si un alelo es codominante, su efecto fenotípico será intermedio en el heterocigoto en relación con el efecto de un homocigoto dominante y el de un homocigoto recesivo.

Page 31: Medidas de la Diversidad Genética

7

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 7

f La descripción del conjunto de genes que hereda un individuo de sus progenitores

f El genotipo de un individuo permanece invariable a lo largo de su vida, con independencia del entorno que lo rodea y afecta

Genotipo es …

En general, el término ‘gen’ se refiere a la entidad física que se transmite de los progenitores a la descendencia durante el proceso reproductivo que influye en los caracteres hereditarios. El genotipo de un individuo es la suma de todos los genes heredados de sus progenitores. Los genes determinan la composición de las proteínas e influyen en los caracteres externos y en el comportamiento.

Page 32: Medidas de la Diversidad Genética

8

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 8

f La variación genética está asociada con el concepto de genotipo

f En la mayoría de las poblaciones naturales existe una variación genética en los caracteres. Estos caracteres reciben la influencia de los alelos de diversos genes, además de los efectos del entorno

f Es difícil atribuir las diferencias fenotípicas a los efectos de genes específicos

Variación genética

La variación genética oculta es mucho más extensa que la que se observa a través del fenotipo; tanto es así, que es prácticamente imposible que dos individuos en una población tengan el mismo genotipo en todo los loci. Esta variación genética puede detectarse mediante tecnologías moleculares que evidencian polimorfismos, los cuales resultan útiles como marcadores genéticos. Sin embargo, incluso las herramientas moleculares tienen sus limitaciones y, salvo en el caso de comparaciones de toda la secuencia de ADN, la mayoría de los métodos se limitan a cierto número de genes o loci. Aún así, generalmente se encuentra suficiente variación en las muestras de genes para que sea posible evaluar la variación genética en la mayoría de las poblaciones.

Como se mencionó anteriormente, debido a que casi siempre se examina solamente un pequeño fragmento del genoma en los estudios sobre variación genética, surgen preguntas acerca de la confiabilidad de los resultados para ser extrapolados a las poblaciones naturales. Esta es una razón de peso para planear cuidadosamente los experimentos y prestar especial atención al muestreo tanto de los individuos como de los loci que van a ser evaluados.

Page 33: Medidas de la Diversidad Genética

9

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 9

f ‘La presencia de muchas formas’

f En términos genéticos, se refiere a la coexistencia de dos o más fenotipos alternos en una misma población o entre poblaciones. Por lo general, los diversos fenotipos son originados por los alelos alternos de un gen

f A nivel molecular, el polimorfismo se refiere a la coexistencia de patrones alternos de bandas o variantes de ADN que se evidencian mediante métodos de detección

¿Qué es polimorfismo?

Se dice que un gen o un carácter fenotípico es polimórfico si en una población existe más de una forma del gen o carácter. La variación genética, que puede originar cambio evolutivo, siempre está presente.

En el módulo de aprendizaje Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas hay información adicional acerca del concepto de polimorfismo en general y sobre el polimorfismo molecular en particular (clic aquí).

Page 34: Medidas de la Diversidad Genética

10

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 10

f Ecológicamente como:Un grupo de individuos de la misma especie que habitan dentro de una zona geográfica restringida que permite el apareamiento de dos individuos cualquiera

f Genéticamente como:Un grupo de individuos que comparten un acervo genético común y tienen la posibilidad de aparearse

Una población se define …

Las poblaciones son entidades muy complejas. La genética de poblaciones trata de la unidad local de apareamiento porque los cambios en las frecuencias alélicas ocurren dentro de estas unidades limitadas y pueden dar lugar a la evolución de los caracteres adaptativos. Estas unidades locales se denominan generalmente poblaciones locales, subpoblaciones o, simplemente, poblaciones. Normalmente, en una población, los miembros de una especie se distribuyen de manera desigual. La subdivisión de las poblaciones se debe a menudo a los accidentes en su entorno. En principio, el tamaño de una población no es infinitamente grande ni tampoco permanece constante.

Page 35: Medidas de la Diversidad Genética

11

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 11

Se identifican tres niveles de estructura poblacional:• Organismos individuales• Subpoblaciones• Población total

Estructura poblacional

Una población puede ser considerada como una unidad. Sin embargo, en muchasespecies y en numerosas circunstancias, las poblaciones se subdividen en unidades de menor tamaño. Dicha subdivisión puede ser el resultado de factores ecológicos (los hábitats no son continuos) o de comportamiento (reubicación consciente o inconsciente). Si una población se subdivide, los vínculos entre sus partes pueden variar según el grado de flujo génico real que exista.

Una población se considera estructurada si (1) hay deriva genética en algunas de sus subpoblaciones, (2) la migración no se da uniformemente en toda la población, o (3) el apareamiento no ocurre al azar en toda la población. La estructura de una población afecta el grado de variación genética y los patrones de su distribución.

Si desea obtener más detalles acerca de esos conceptos nuevos (por ejemplo, flujo génico, migración), consulte las siguientes diapositivas y el Glosario.

Page 36: Medidas de la Diversidad Genética

12

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 12

Población X

p = 0.10 (frecuencia del alelo A)q = 0.90 (frecuencia del alelo a)

Población migratoria Y

Los insectos polinizadores llevan granos de polen desde la población Y (alelo a > alelo A) hasta la población X

p = 0.80 (frecuencia del alelo A)q = 0.20 (frecuencia del alelo a)

Flujo génico

a

a

Aa

a

a

Aa

El flujo génico es el paso y establecimiento de los genes característicos de una población en el acervo genético de otra mediante la hibridación y el retrocruzamientonaturales o artificiales.

En el dibujo de la diapositiva, la población Y tiene una frecuencia mayor del alelo a (q = 0.90). Los insectos polinizadores que visiten esa población transportarán más copias del alelo ‘a’ cuando viajen a otra población X. El efecto resultante del flujo génico se observa en las generaciones posteriores de la población X como un aumento de la frecuencia del alelo migratorio a.

Page 37: Medidas de la Diversidad Genética

13

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 13

f La frecuencia alélica es el concepto utilizado para cuantificar la variación genética

f Se define como una medida de la presencia de un alelo dado en una población; es decir, la proporción de todos los alelos de ese gen en la población que corresponden específicamente a ese tipo

Frecuencia alélica

Un alelo es una forma alterna de un gen. Si un gen corresponde a una secuencia específica de nucleótidos a lo largo de una molécula de ADN, los alelos representan las diferentes secuencias de nucleótidos que son posibles para ese locus específico.

El término ‘gen’ muchas veces se utiliza como sinónimo de ‘alelo’ y, en consecuencia, a veces la expresión ‘frecuencia génica’ se usa como sinónimo de ‘frecuencia alélica’. Las diferencias alélicas en un locus único en una población indican variación genética. Esta variación genética deber ser cuantificada para los diferentes genes y para losdiferentes individuos o poblaciones.

Page 38: Medidas de la Diversidad Genética

14

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 14

P(A) = [2(AA) + (Aa)]/2n

f Dos veces el número de genotipos homocigotos con ese alelo (porque los homocigotos portan cada uno dos copias del mismo alelo),

f más el número de genotipos heterocigotos con ese alelo (porque los heterocigotos portan solamente una copia de un alelo particular),

f dividido por dos veces el número total de individuos en la muestra (porque cada individuo porta dos alelos por locus)

Cálculo de la frecuencia alélica

Obsérvese que cualquier resultado obtenido con esta fórmula solamente será una estimación de la frecuencia alélica total en la población, porque por lo general solamente se estudia una muestra de individuos. Sin embargo, si el muestreo de individuos se realiza de manera acertada, es decir, si el tamaño de la muestra es suficientemente grande, entonces puede suponerse que nuestro cálculo se acerca a la frecuencia alélica real. Como regla empírica y en la medida de lo posible, los cálculos de la frecuencia alélica deber realizarse en muestras de 100 individuos o más.

Page 39: Medidas de la Diversidad Genética

15

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 15

f Es la frecuencia de un genotipo dado en una población

f Las frecuencias de diversos tipos de sistemas de apareamiento determinan la relación matemática entre las frecuencias alélicas y genotípicas

Frecuencia genotípica

El sistema natural de apareamiento de individuos puede revisarse mediante estudios de las frecuencias con que se presentan los genotipos alternos en una población. Cuando una población experimenta apareamiento al azar en relación con los alelos de interés, pueden esperarse ciertos patrones de frecuencia genotípica.

Las frecuencias genotípicas se utilizan también para estimar la cantidad de autopolinización que se presenta en poblaciones de individuos que tienen este tipo de reproducción o un tipo de reproducción mixta. En consecuencia, el sistema de apareamiento afecta de manera significativa la frecuencia de la presencia de genotipos alternos en una población.

Page 40: Medidas de la Diversidad Genética

16

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 16

f Una población cuyo apareamiento se realice al azar da lugar a una distribución en equilibrio de genotipos después de tan solo una generación, de manera que se conserva la variación genética

f Cuando se cumplen las suposiciones, la frecuencia de un genotipo es igual al producto de las frecuencias alélicas

AA Aa aap2 2pq q2

El principio de Hardy-Weinberg

El equilibrio de H-W afirma que la reproducción sexual no reduce la variación genética de generación en generación. Por el contrario, la cantidad de variación permanece constante si no hay fuerzas perturbadoras que actúan contra ella. Establece la relación para calcular las frecuencias genotípicas en condiciones de apareamiento al azar y, al hacerlo, provee el fundamento para muchos estudios sobre genética de poblaciones.

Este principio describe las expectativas para frecuencias alélicas en una situación idealizada donde,

• El organismo es diploide

• La reproducción es sexual

• Las generaciones no se superponen entre sí

• El apareamiento ocurre al azar

• El tamaño de la población es muy grande

• La migración es mínima

• Las mutaciones pueden ignorarse

• La selección natural no afecta los alelos que se están considerando

¡Obsérvese que la mayoría de las plantas cultivadas infringen al menos una de estas suposiciones!

Page 41: Medidas de la Diversidad Genética

17

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 17

Demostración del principio de H-W

Frecuencias genotípicas

Generación 0

N �

A1 A1 , A1 A2 , A2 A2

p2, 2pq, q2

Las frecuencias genotípicas no cambian de generación en generación

Ƃ gametos

A1 A2

A2A1

ƃ gametos

(p)

(p) (q)

(q)

A2 A2 (q2)

A1 A1 (p2) A1 A2 (pq)

A1 A2 (pq)

Ƃƃ A2A1

A1

A2

Apareamiento al azar

Cigotos

N �

A1 A1 , A1 A2 , A2 A2

p2, 2pq, q2

Generación 1

p2 + 2pq + q2 = (p + q)2 = 1

El punto de partida es la generación 0. Tenemos un gen con dos alelos, A1 y A2. La frecuencia del alelo A1 es p y la frecuencia del alelo A2 es q. Las frecuencias genotípicas en la generación 0 son para A1 A1 = p2, para A1 A2 = 2pq y para A2 A2 = q2. Si el apareamiento es aleatorio, la probabilidad de que cualquier alelo de la planta femenina se reúna con cualquier alelo de la planta masculina será la misma. El cuadro que aparece a la derecha de la diapositiva ilustra los cuatro genotipos posibles para la generación siguiente. La frecuencia de ocurrencia de cada genotipo es dada por el producto de la frecuencia de cada alelo en el genotipo (por ejemplo, para A1 A1 es p x p = p2). Si se resumen los resultados del cuadro, como aparece en la figura azul insertada en la parte inferior de la diapositiva, observamos que las frecuencias genotípicas en la generación 1 siguen siendo las mismas que en la generación anterior.

Page 42: Medidas de la Diversidad Genética

18

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 18

0.42

0.42

0.42

A1 A2

0.49

0.49

0.49

A1 A1

Genotipos de G1

0.3

0.3

0.3

q

0.09

0.09

0.09

A2 A2

0.7

0.7

0.7

p

G0 G1Genotipos de G0

0.7

0.7

0.7

p

0.3

0.3

0.3

q

0.00.60.4Pobl. 3

0.090.420.49Pobl. 2

0.20.20.6Pobl. 1

A2 A2A1 A2A1 A1Poblac.

Frecuencias

Un ejemplo de tres poblaciones en equilibrio de Hardy-Weinberg

Las frecuencias genotípicas de la población aparecen en las filas y las generaciones (G0 y G1) en las columnas. Nuevamente, tenemos un gen con dos alelos, A1 y A2. La frecuencia del alelo A1 es p y la frecuencia del alelo A2 es q. Las frecuencias genotípicas difieren para cada población en la generación 0 (por ejemplo, la frecuencia de A1 A1 en la población 1 es de 0.6; en la población 2, 0.49; y en la población 3, 0.4, y así sucesivamente para los demás genotipos). Sin embargo, observamos que las frecuencias alélicas en las tres poblaciones son similares en G0(p = 0.7 y q = 0.3). En la siguiente generación, G1, si se cumplen todos los requerimientos del principio de H-W , las frecuencias genotípicas en las tres poblaciones tienden a equilibrarse (ahora la frecuencia de A1 A1 es de 0.49 en las tres poblaciones, y lo mismo ocurre con las frecuencias de A1 A2 y A2 A2 ). Las frecuencias alélicas se mantienen.

Page 43: Medidas de la Diversidad Genética

19

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 19

f Esta prueba hipotética es útil para determinar si las frecuencias alélicas están en equilibrio de H-W

f El procedimiento es el siguiente:• Definir H0 (y Ha)• Definir el nivel de significancia D• Realizar la prueba estadística• Aplicar los criterios de decisión

La prueba Chi-cuadrado

H0 = la hipótesis que afirma que las frecuencias alélicas para el carácter Q en una población dada están en equilibrio de H-W. Ha = una hipótesis alterna que afirma que las frecuencias alélicas para el carácter Q no están en equilibrio.

Elegimos un nivel de significancia que confiera cierto porcentaje de confianza en nuestros resultados. La prueba estadística se deriva de la fórmula:

Donde,PE = prueba estadística k = número de clases genotípicasO = frecuencias observadas m = número de alelosE = frecuencias esperadas df = grados de libertad

Si nuestra muestra permite solamente 1 grado de libertad, entonces la diferencia en frecuencia se reduce por 0.5, un factor de corrección, tal como:

Los criterios de decisión se aplican del siguiente modo:

Si F2cal � F2

tab se acepta H0; y, si F2cal > F2

tab, se rechaza H0

Donde, cal = el resultado de calcular la PE con los datos obtenidos en nuestra muestratab = el valor identificado en la tabla (se puede encontrar en el Apéndice 1; haga clic aquí).

> @Ei

0.5EiOi 2 ��

> @mdfk

22

(Ei)EiOi

PE � »»¼

º

««¬

ª � ¦ Ȥ

Page 44: Medidas de la Diversidad Genética

20

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 20

D = 0.05

Genotipo AA Aa aaNo. observado 169 520 311No. esperado 250 500 250Cálculo de X2 (169-250-0.5)2/250 (520-500-0.5)2/500 (311-250-0.5)2/250Valor de X2 +25.921 +0.760 +14.641 41.322

Criterio de decisión:

F2cal (41.322) > F2

tab (3.8) Se rechaza H0

Aplicación de la prueba F2: Un ejemplo

En este ejemplo, digamos que las frecuencias alélicas fueron 0.429 para A1 y 0.571 para A2. Cada clase genotípica se representó como aparece en el cuadro en la diapositiva.

Las hipótesis que se están probando son las siguientes:

H0 = esta población está en equilibrio de H-W respecto a sus frecuencias alélicasHa = esta población no está en equilibrio de H-W respecto a sus frecuencias alélicas

Dado que el número de clases genotípicas es 3 y, por consiguiente, tenemos sólo 1 grado de libertad, aplicamos el factor de corrección en nuestro cálculo de los elementos F2.

El F2 calculado es 41.322. Con esta cifra y con un margen de error de 0.05%, las pruebas estadísticas rechazan H0, lo que significa que esta población no está en equilibrio de H-W respecto al carácter que está siendo estudiado.

Page 45: Medidas de la Diversidad Genética

21

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 21

f Cálculo de la frecuencia alélica con un marcador codominante

f Cálculo de la frecuencia alélica con un marcador dominante

f Cálculo de la frecuencia alélica con un gen codominante que posee alelos múltiples

Cálculo de la frecuencia alélica: Ejemplos

En las diapositivas siguientes, presentamos ejemplos de los cálculos de frecuencias alélicas para los resultados obtenidos con diferentes tipos de marcadores. Los ejemplos se presentan con gráficos que emulan geles reales y las bandas obtenidas mediante técnicas de marcadores moleculares. Si desea obtener más detalles sobre las tecnologías de marcadores moleculares y la interpretación de bandas, remítase al módulo de aprendizaje Tecnologías de Marcadores Moleculares para Estudios de Diversidad Genética de Plantas (clic aquí).

Page 46: Medidas de la Diversidad Genética

22

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 22

Indiv. 1 Indiv. 2 Indiv. 3A1 1 1 0A2 0 1 1

Lectura de bandas

Individuos

Genotipos

M

Locus A

A1A

1

A1A

2

A2A

2

Gel1 2 3

1,0 1,1 0,1Locus A

M 1 2 3

… con un marcador codominante

(continúa en la siguiente)

Con un marcador codominante, pueden observarse los genotipos de las clases genotípicas (dos homocigotos y el heterocigoto). En el dibujo, en la parte centro superior, observamos una imagen de un gel con el patrón de bandas de un marcador codominante para un locus de un organismo diploide. Necesitamos tomar los datos a las bandas en el gel y convertirlas en números. Para hacerlo, se registra la presencia de una banda (la banda en la misma fila) y se convierte en 1, o en 0 si está ausente. Podemos hacerlo por banda, como aparece en el cuadro en la parte inferior izquierda, o por genotipo, como aparece en la esquina inferior derecha. En el cuadro que aparece a continuación, observamos los cálculos de las frecuencias genotípicas, tanto esperada como observada, y los de las frecuencias alélicas. (M = marcador de tamaño).

1P22 = n22/n= 0.70

P12 = n12/n= 0.10

P11 = n11/n= 0.20

Frecuencia genotípica(observada)

n = 200n22 = 140n12 = 20n11 = 40Número de individuos

1q22pqp2Frecuencia genotípica(esperada)

TotalA2 A2A1 A2A1 A1Genotipos

p = (2n11/2n) + (n12/2n) = P11 + ½ P12 = 0.20 + ½ (0.10) = 0.25

q = (2n22/2n) + (n12/2n) = P22 + ½ P12 = 0.70 + ½ (0.10) = 0.75

Page 47: Medidas de la Diversidad Genética

23

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 23

1,1 1,0 1,1 0,1 0,1 1,1 1,0 0,1 0,1 0,1

1 2 3 4 5 6 7 8 9 10

Locus ALocus BLocus D

1,0 1,0 1,0 1,1 0,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,1 0,1 0,1 1,1 0,1 0,1 1,1 1,1

M

Locus A

Locus B

Locus D

IndividuosM 1 2 3 4 5 6 7 8 9 10

… con un marcador codominante (continuación)

Este ejemplo es similar al de la diapositiva anterior, pero con 10 individuos y tres locisegregantes (A, B y D). Para facilitar la presentación, se utiliza solamente un método de lectura (parte inferior de la diapositiva). (M = marcador de tamaño).Obsérvese que solamente se puede obtener un gel, como el del ejemplo, mediante electroforesis múltiple, es decir, cargando en el mismo pocillo diferentes mezclas de reacción. Los cálculos de frecuencias genotípicas y alélicas se presentan a continuación. (esp. = valores esperados; obs. = valores observados).

Frec. alélica

0.40

p

0.85

p

0.35

p

1

10

1

Total

1

10

1

Total

1

10

1

Total

q

D2 D2D1 D2D1 D1Genotipos

Dq22pqp2Frec. genotípica (esp.)

442Número de indiv.

0.60P22 = 0.4P12 = 0.4P11 = 0.2Frec. genotípica (obs.)

q

B2 B2B1 B2B1 B1Genotipos

Bq22pqp2Frec. genotípica (esp.)

118Número de indiv.

0.15P22 = 0.1P12 = 0.1P11 = 0.8Frec. genotípica (obs.)

0.65P22 = 0.5P12 = 0.3P11 = 0.2Frec. genotípica (obs.)

Análisis de datosLocus

2

p2

A1 A1

53Número de indiv.

q22pqFrec. genotípica (esp.) q

A2 A2A1 A2Genotipos

A

Page 48: Medidas de la Diversidad Genética

24

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 24

1 0 Locus A

M 1 2

Lectura de bandas

Genotipos

Gel M

Locus A

AA

, A a

a a

1 2Individuos

… con un marcador dominante

(continúa en la siguiente)

Con un marcador dominante, pueden observarse sólo dos clases genotípicas: AA + Aa y aa; es decir, una de las clases homocigóticas se confunde con el heterocigoto. El gel con el patrón de bandas de un marcador dominante para un locus mostrará, para cada individuo, ya sea una banda o ninguna. Las bandas se registran de modo similar al empleado con un marcador codominante, donde se les asigna un 1 si están presentes, o 0 si están ausentes. (M = marcador para el tamaño).

Los cálculos de frecuencias se realizan según se indica en el cuadro que aparece a continuación. (p, q = frecuencias alélicas).

aaA _Fenotipos

1P2 = n2/n = 0.16P1 = n1/n = 0.84Frecuencias fenotípicas (observadas)

n = 100n2 = 16n1 = 84Número de individuos

1q2p2 + 2pqFrecuencias fenotípicas (esperadas)

TotalaaAaAAGenotipos

q = ¥(n2/n) = ¥(P2 ) = ¥(0.16 ) = 0.4

p = (1 – q ) = 0.6

Este cálculo está sesgado porque no considera los alelos recesivos presentes en los homocigotos.

Page 49: Medidas de la Diversidad Genética

25

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 25

… con un marcador dominante (continuación)

1 0 1 1 0 1 1 1 1 1

M 1 2 3 4 5 6 7 8 9 10

Locus ALocus BLocus D

0 1 0 0 0 1 0 0 1 0 1 1 1 1 0 1 1 0 1 1

Locus A

Locus B

Locus D

M 1 2 3 4 5 6 7 8 9 10Individuos

Aquí tenemos un ejemplo parecido al anterior, pero con 10 individuos y tres loci segregantes (A, B y D). (M = marcador para el tamaño.)

No se califican las bandas que no presentaron segregación (monomórficas) y, por tanto, éstas no se incluyen en el análisis.

A continuación está el cuadro con los cálculos de las frecuencias genotípicas y alélicas:

Frec. alélicaAnálisis de datosLocus

0.450.551P2 = 0.2P1 = 0.8Frecuencia genotípica (obs.)

1028Número de individuos

1q2p2 + 2pqFrecuencia genotípica (esp.) qp

TotalD2 D2D1 _Genotipos

D

0.84

q

0.45

q

0.16

p

0.55

p

TotalB2 B2B1 _Genotipos

B1q2p2 + 2pqFrecuencia genotípica (esp.)

1073Número de individuos

1P2 = 0.7P1 = 0.3Frecuencia genotípica (obs.)

1P2 = 0.2P1 = 0.8Frecuencia genotípica (obs.)

8

p2 + 2pq

A1 _

102Número de individuos

1q2Frecuencia genotípica (esp.)

TotalA2 A2Genotipos

A

No podemos distinguir los heterocigotos, pero sí podemos estimar el número esperado de heterocigotos en una población. Por ejemplo, si el tamaño de la muestra = 1000, entonces:Para el locus A, el número esperado de heterocigotos = 2pqN = 2(0.55)(0.45)(1000) = 495Para el locus B, el número esperado de heterocigotos = 2pqN = 2(0.16)(0.84)(1000) = 269y así sucesivamente ...

Page 50: Medidas de la Diversidad Genética

26

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 26

P23 = n23/n

n23

2p2p3

A2 A3

Pnn = nnn/n

nnn

pn2

An An

...

...

...

...

P13 = n13/n

n13

2p1p3

A1 A3

P22 = n22/n

n22

p22

A2 A2

P12 = n12/n

n12

2p1p2

A1 A2

1P11 = n11/n

Frecuencias genotípicas (observadas)

nn11Número de individuos

1p12Frecuencias genotípicas

(esperadas)

TotalA1 A1Genotipos

p1 = P11 + ½Ȉi z 1 P1j p2 = P22 + ½Ȉj z 2 P2j

p3 = P33 + ½Ȉj z 3 P3j p4 = P44 + ½Ȉj z 4 P4j

pn = Pnn + ½Ȉj z n Pnj

... con un gen codominante con múltiples alelos

(continúa en la siguiente)

Esta es la situación típica cuando se utilizan marcadores tipo microsatélites.

Tenemos un locus A con n alelos A1, A2, A3, ..., An y frecuencias alélicas p1, p2, p3, ..., pn, respectivamente, siendo A1 = A2 = A3 = ... = An

Page 51: Medidas de la Diversidad Genética

27

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 27

Lectura de bandas

Ind.1 Ind.2 Ind.3 Ind.4 Ind.5 Ind.6A1 1 1 1 0 0 0A2 0 1 0 1 1 0A3 0 0 1 0 1 1

Locus A

MGel

A2A

3

A1A

1

A2A

2

A1A

2

A1A

3

A3A

3

1 2 3 4 5 6Individuos

Genotipos

... con un gen codominante con múltiples alelos (continuación)

(1,0,0) (1,1,0) (1,0,1) (0,1,0) (0,1,1) (0,0,1)Locus A

M 1 2 3 4 5 6

Con un marcador codominante se pueden observar genotipos de las tres clases. En el dibujo de arriba, en la parte central superior, observamos una imagen de gel con el patrón de bandas de un marcador codominante con tres alelos (A1, A2 y A3) en una muestra diploide. Cada banda (cada fila) se registra en forma separada y le asignamos un 1, si está presente, o un 0, si no lo está. Podemos hacerlo por banda (esquina inferior izquierda de la diapositiva) o por genotipo (esquina inferior derecha). En el cuadro que aparece a continuación, observamos los cálculos de las frecuencias genotípicas tanto esperada como observada, así como las frecuencias alélicas (p1, p2 y p3). (M = marcador para el tamaño).

P33 = n33/n = 0.08

n33 = 2

p32

A3 A3

P23 = n23/n = 0.08

n23 = 2

2p2p3

A2 A3

P13 = n13/n =

0

n13 = 0

2p1p3

A1 A3

P22 = n22/n = 0.42

n22 = 10

p22

A2 A2

P12 = n12/n = 0.25

n12 = 6

2p1p2

A1 A2

1P11 =

n11/n = 0.17

Frecuencia genotípica

(obs.)

n = 24n11 = 4Número de individuos

1p12

Frecuencia genotípica

(esp.)

TotalA1 A1Genotipos

p1 = P11 + ½P12 + ½P13 = P11 + ½Ȉj z 1 P1j = 0.17 + ½(0.25 + 0.00) = 0.30

p2 = P22 + ½P21 + ½P23 = P22 + ½Ȉj z 2 P2j = 0.42 + ½(0.25 + 0.08) = 0.59

p3 = P33 + ½P31 + ½P32 = P33 + ½Ȉj z 3 P3j = 0.08 + ½(0.00 + 0.08) = 0.12

Page 52: Medidas de la Diversidad Genética

28

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 28

f Alogamia, endogamia o reproducción asexual

f Influyen en:• El grado de afinidad genética entre parejas• La organización de genes en los genotipos

Sistemas de reproducción y apareamiento

En principio, la alogamia se presenta como apareamiento al azar, y tanto la endogamia como la reproducción asexual son tipos de apareamiento no aleatorio.

Las especies alógamas, en comparación con los organismos endogámicos, puede retener números considerables de alelos recesivos deletéreos porque la situación de dominancia los oculta. Los alelos recesivos experimentan recombinación frecuente, dando lugar a nuevos tipos gaméticos.

La dominancia se refiere a las situaciones donde, en condiciones heterocigóticas, un alelo tiene un efecto fenotípico lo suficientemente acentuado como para ocultar la presencia del otro alelo (recesivo). En una situación de dominancia pueden observarse sólo dos fenotipos: el fenotipo dominante, que es una mezcla del homocigoto dominante y el heterocigoto, y el fenotipo recesivo.

En las especies de polinización cruzada, la autogamia conduce a la consanguineidadporque la proporción de homocigotos aumenta, permitiendo de esta manera que alelos recesivos poco usuales se vuelvan visibles. En las especies de polinización cruzada, los heterocigotos tienen un efecto más favorable.

La reproducción asexual puede ser una modalidad constante de reproducción, pero también puede estar combinada con ciclos de reproducción sexual, que permite la recombinacion de la variación actual y, como tal, la generación de nuevas formas o combinaciones. Si solamente se da la reproducción asexual en la población, las frecuencias genotípicas no pueden cambiar.

Page 53: Medidas de la Diversidad Genética

29

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 29

f El apareamiento que ocurre al azar, es decir, aquel en que la probabilidad de que el individuo A se aparee con el individuo B no depende de los genotipos de ninguno de los dos

f Si el apareamiento ocurre al azar, la probabilidad de que un individuo se aparee con un genotipo dado será igual a la frecuencia de ese genotipo en la población

Apareamiento al azar

El apareamiento al azar es una característica propia de muchas poblaciones alogámicas. Por ejemplo, podemos tener una población, compuesta en un 10% por genotipos AA; en un 58% por genotipos Aa y en un 32% por genotipos aa. Si el apareamiento se realiza al azar, entonces las posibilidades de que un individuo AA se aparee con otro AA son de 10/100; de que se aparee con un individuo Aa, de 58/100; o que se aparee con un individuo aa, de 32/100.

Page 54: Medidas de la Diversidad Genética

30

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 30

f Apareamiento clasificado:• Positivo: apareamiento

entre individuos con fenotipos similares

• Negativo: apareamiento entre individuos con fenotipos disímiles

f Endogamia: • Apareamiento entre

parientesConsanguíneos

X X

X

Línea pura

Progenitores

Apareamiento no aleatorio

El apareamiento no aleatorio se presenta cuando los individuos que están relacionados más estrechamente (endogamia) o menos estrechamente se aparean con más frecuencia de lo que se esperaría por casualidad para la población.

La autopolinización o la endogamia es similar al apareamiento entre parientes. Aumenta la homocigosis de una población y su efecto es generalizado para todos los alelos. La endogamia per se no modifica las frecuencias alélicas; sin embargo, con el transcurso del tiempo, conduce a la homocigosidad al aumentar lentamente las dos clases homocigóticas.

Page 55: Medidas de la Diversidad Genética

31

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 31

f Compara la proporción real de genotipos heterocigotos con los esperados en condiciones de apareamiento al azar

f F es el coeficiente de endogamia y cuantifica la reducción de la heterocigosidad

� �0

0H

HHF �

Coeficiente de endogamia

H = frecuencia real de heterocigotos en la población.H0 = número esperado de heterocigotos en condiciones de apareamiento al azar.

El coeficiente de endogamia señala el grado de endogamia en una población.

Page 56: Medidas de la Diversidad Genética

32

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 32

0 1 2 3 4 5 6 7 8

Generaciones

100.0

75.5

50.0

25.5

0.0

%

HomocigosisHeterocigosis

¿Qué sucede en la autogamia?

G8

G7

G6

G5

G4

G3

G2

G1

G0

Generación

0.39062599.6093832640AA, 256Aa, 32640aa

0.7812599.218758128AA, 128Aa, 8128aa

1.562598.43752016AA, 64Aa, 2016aa

3.12596.875496AA, 32Aa, 496aa

6.2593.75120AA, 16Aa, 120aa

12.587.528AA, 8Aa, 28aa

25756AA, 4Aa, 6aa

50501AA, 2Aa, 1aa

1000Aa

Heterocigosis(%)

Homocigosis(%)

Genotipos autofecundados relación/generación

La autogamia es un sistema potente de endogamia que permite alcanzar niveles altos de homocigosis en pocas generaciones. Simultáneamente, disminuye la heterocigosis. La gráfica en la diapositiva muestra este fenómeno, y, en el cuadro a continuación, observamos los valores cambiantes de los grados de homocigosis y heterocigosis en 9 generaciones (G0 a G8).

Page 57: Medidas de la Diversidad Genética

33

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 33

f Mutación

f Migración

f Recombinación

f Selección

f Deriva genética

Factores que determinan la diversidadgenética

Si, por cualquier circunstancia, una población se vuelve homogénea, no habráevolución. En consecuencia, el cambio constante depende esencialmente de la nueva variación.

Una población genética es la suma de las frecuencias alélicas de todos los genes en esa población. Las poblaciones cambian o evolucionan porque sus frecuenciasgénicas experimentan cambios. Varios factores pueden producir cambios en la capacidad de un individuo para sobrevivir hasta que logre la reproducción. Si cambia la adaptación de un individuo en una población, los genotipos en la generación subsiguiente no estarán directamente relacionados con las frecuencias génicas de la primera población; lo que conlleva a que evolucione la población.

Dado que los cambios en las poblaciones requieren cambios en las frecuencias génicas, es importante entender de qué manera pueden cambiar estas frecuencias. En las diapositivas que aparecen a continuación, tratamos las causas primarias del cambio: la mutación, la migración, la recombinación, la selección y la deriva genética.

Page 58: Medidas de la Diversidad Genética

34

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 34

f Es la principal fuente de variación y puede originarse a causa de:

• Errores en la duplicación del ADN• Daños causados por la radiación

f La mutación aumenta la diversidad; no obstante, dado que las mutaciones espontáneas son poco frecuentes, la tasa de cambio en la frecuencia génica es muy baja

f En consecuencia, la mutación por si sola no conduce a la evolución de poblaciones y especies

Mutación

La mutación más sencilla es aquella que produce un cambio en un nucleótido único en la secuencia de ADN de un gen. Una mutación puede hacer que un alelo cambie a otro que ya se encuentra en la población (de uno dominante a uno recesivo) o puede dar origen a una alelo completamente nuevo. Las mutaciones pueden ser favorables o desfavorables. Muchas serán desfavorables y desaparecerán. No obstante, si son convenientes para el individuo, entonces las frecuencias de ese alelo aumentarán de generación en generación. Además, esta mutación puede migrar hacia otras poblaciones y propagarse.

Nota: Los genomas pueden experimentar un proceso conocido como duplicación de genes. Este hecho le ayuda al individuo a resistir una mutación desfavorable en una copia del gen sin grandes dificultades, porque la otra copia del gen todavía puede funcionar apropiadamente. Cambios adicionales pueden afectar el gen mutado y conferir al individuo distintos tipos de adaptación.

Page 59: Medidas de la Diversidad Genética

35

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 35

f Es el movimiento de individuos o cualquier forma de introducción de genes de una población a otra

f La migración aumenta la diversidad y la tasa puede ser considerable, lo que origina cambios importantes en la frecuencia

f El cambio en la frecuencia génica es proporcional a la diferencia en la frecuencia entre la población receptora y el promedio de las poblaciones donantes

Migración

Desde una perspectiva genética, la migración implica no solo el movimiento de individuos hacia poblaciones nuevas, sino la introducción de alelos nuevos en la población (flujo génico). Los cambios en las frecuencias génicas se producirán bien sea porque se traerán más copias de un alelo ya presente en la población o porque llega un alelo nuevo.

Varios factores afectan la migración en las especies de cultivos:

• Sistema de apareamiento

• Simpatria con parientes silvestres y/o malezas

• Polinizadores

• Dispersión de semillas

El efecto inmediato de la migración es aumentar la variabilidad genética de una población y, como tal, ayuda a aumentar las posibilidades de que esa población resista los cambios del entorno. La migración también ayuda a integrar poblaciones y a evitar su divergencia.

Page 60: Medidas de la Diversidad Genética

36

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 36

f Es el proceso mediante el cual una célula genera nuevas combinaciones cromosómicas, en comparación con esa célula o con las de sus progenitores

f No da origen a diversidad nueva sino que genera nuevas combinaciones de la diversidad existente

f Si existen alelos segregantes en varios loci, la variación genética por recombinación puede ocurrir rápidamente

Recombinación

La diversidad genética a través de la recombinación es el resultado de la reorganización de los componentes genéticos del tipo original. Existen mecanismos para generar diversidad alélica (recombinación intragénica) y diversidad genómica(nuevas combinaciones de multigenes).

Page 61: Medidas de la Diversidad Genética

37

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 37

Es la capacidad heredada que poseen los organismos para sobrevivir y reproducirse. Funciona de tal manera que, con el tiempo, los genotipos superiores aumentan su frecuencia en la población

Selección

Como resultado de la mutación se desarrollan nuevas formas. Estas formas, según se explica, pueden favorecer o perjudicar la capacidad que posee el individuo para sobrevivir. Si los cambios son beneficiosos, entonces los alelos nuevos tenderán a prevalecer al ser seleccionados en la población.

El efecto de la selección en la diversidad puede ser:

• Direccional, donde disminuye la diversidad.

• Equilibrante, donde aumenta la diversidad. Los heterocigotos tienen la mayor capacidad de adaptación, de manera que la selección favorece el mantenimiento de alelos múltiples.

• Dependiente de la frecuencia, en cuyo caso aumenta la diversidad. La capacidad de adaptación depende del alelo o de la frecuencia genotípica, y cambia con el tiempo.

Page 62: Medidas de la Diversidad Genética

38

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 38

Cigotos

a

Aa

a

aa

a

AA

A

AAaA

AA aa aaAA

aA aA aA

AA AA

aA

AA aa aaAA

aAAA AA

a

a

a

aa

aA

A

AA A

a

a

a aa

AA aa aa

aA AA

a

a

a

aa

aA A

a

a

a aaaa aa

aaa

a

a

a

a

a

aa

a

a

a

a aaaa aa

a

a

a

aa aa

aa

Acervo genético

Muestreo de gametos

G0

p = 0.5 q = 0.5

G1

p = 0.625 q = 0.375

G2

p = 0.3125 q = 0.6875

G3

p = 0.0 q = 1.0

Deriva genética

La deriva genética se refiere a las fluctuaciones en las frecuencias alélicas que ocurren por casualidad (en particular en las poblaciones pequeñas) como resultado del muestreo al azar entre los gametos.

La deriva disminuye la diversidad dentro de una población porque tiende a causar la pérdida de alelos poco usuales, reduciendo el número total de alelos.

En el ejemplo de la diapositiva, el tamaño de la población es constante en cada generación (8 individuos). Cada individuo puede producir miles de gametos, pero apenas se necesitan 2N gametos por individuo (16 en nuestro ejemplo) del acervo genético total en cada generación. Esta situación se asemeja a la extracción de muestras pequeñas de dos cajas: una de ellas contiene un millón de bolas blancas y la otra un millón de bolas rojas. En cada experimento de extracción, podemos tomar un número diferente de bolas blancas y rojas. Simulamos que, en la generación G0, 10 gametos de los miles posibles portaban el alelo A y apenas 6 portaban el alelo a. En G1, de aquellos gametos que participaron en la constitución de los cigotos para la siguiente generación, 5 portaban el alelo A y 11 el alelo a, y así sucesivamente. Estos valores varían al azar. En la generación G3, todos los individuos están formados por el alelo a (homocigotos) y el alelo A se pierde.

Page 63: Medidas de la Diversidad Genética

39

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 39

f Ne es el número de progenitores encargados de la composición genética de la siguiente generación

f Ne es, por lo general, menor que N debido a:• La variación en el tamaño de la población de

generación en generación• La relación desigual entre sexos• Las generaciones que se sobreponen• La dispersión geográfica de las poblaciones

Tamaño efectivo de la población

¿Qué tan grande es la población?

• El número real de individuos en una población se denomina el número de censo (N). Este número es, casi siempre, una representación imprecisa del tamaño de la población desde un punto de vista genético.

• El tamaño efectivo de la población (Ne) describe el tamaño de una población ideal que muestra la misma tasa de pérdida de la variación genética, debida a la deriva genética, que la población de interés.

Page 64: Medidas de la Diversidad Genética

40

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 40

f Deriva genética, con variación aleatoria de las frecuencias alélicas

f Endogamiaf Homocigosis: fijación y pérdida de alelosf Diferenciación de subpoblaciones

aaAa

AA

AA

AA

aa

aa

Aa

AA

AAaa

aaAa

AA

AA

aa

aa

Aa

AA

AAaa

aa

AaAa

AaAa

AaAa

Aa

AAAA

aa

Aa

AA

AA

Aa

aa AAAA

aa

AaAA

AA

AAAA

Diferenciación de poblaciones

Apareamiento entre parientes

Se reduce el tamaño de la

poblaciónaa

AA

Aaaa

aaaaaa

aa

AA

AA

AAAA AA

AAAAAA

AA

Aumenta la homocigosis

aaaa

aa

aa

aaaa

aaaa

aa

Fijación

Consecuencias de un tamaño de poblacióndecreciente

(continúa en la siguiente)

Varios acontecimientos que reducen el tamaño de la población son:

• La domesticación

• La existencia de subpoblaciones (endogamia, reproducción clonal)

• La dispersión de largo alcance (efecto fundador)

• La regeneración de las colecciones de recursos genéticos

Page 65: Medidas de la Diversidad Genética

41

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 41

f Cuando el tamaño de la población disminuye en forma dramática se forma un cuello de botella

f Se produce un efecto fundador cuando unos pocos individuos colonizan y se establecen en un nuevo entorno

N

tiempo

Cuello de botella

A1A2

A1A1

A2A2

A2A2A2A2 A2A2 A2A2

A2A2 A2A2

A2A2

A2A2

A1A2 A1A2

A1A2 A1A2

A1A2

A1A2

A1A2A1A1

A1A1

A1A1A1A1 A1A1

A1A1

A1A1

A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

A2A2 A2A2

p = 0.5 (frecuencia de A1)q = 0.5 (frecuencia de A2)

p = 0.0 (frecuencia de A1)q = 1.0 (frecuencia de A2)

Consecuencias … (continuación)

Las poblaciones pequeñas son muy vulnerables a la extinción porque la muestra que sobrevive quizás no sea representativa del acervo genético previo a la disminución.

Ambos efectos dependen del número de sobrevivientes (o colonizadores) y la tasa de crecimiento de la población.

El gráfico que aparece en la diapositiva muestra un efecto de cuello de botella. A la izquierda, se encuentra una población en equilibrio de Hardy-Weinberg con frecuencias alélicas de 0.5. Si ocurre una reducción súbita y se restablece el tamaño original, el resultado puede ser que se pierdan unos alelos y se fijen otros. En el ejemplo a la derecha, solamente sobrevivió A2A2 y el alelo A1 se perdió.

Page 66: Medidas de la Diversidad Genética

42

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 42

f La heterocigosis disminuye a una tasa de:

H1 = (1 – 1/2N)H0

f Los alelos se pierden a una tasa de:

P = p2N + q2N

Con el efecto de cuello de botella y el efecto fundador …

• Disminución de la heterocigosis

Donde,H1 = heterocigosis finalH0 = heterocigosis inicialN = tamaño de la población

Entonces:Si N = 100 y H0 = 0.25, H1 = 0.24875Si N = 40 y H0 = 0.25, H1 = 0.24685

• Pérdida de alelos

Donde,P = pérdida de alelosp y q = frecuencias alélicas2N = número total de alelos en la población

Entonces:Si N = 100, p = 0.90 y q = 0.1, P = 7.05508 x 10-10

Si N = 15, p = 0.90 y q = 0.1, P = 0.0423911Si N = 10, p = 0.90 y q = 0.1, P = 0.12157665

Page 67: Medidas de la Diversidad Genética

44

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 44

Para analizar e interpretar los datos de diversidad genética, debemos estar familiarizados con:

• Algunas definiciones básicas de la genética de poblaciones

• El principio de Hardy-Weinberg• La manera de calcular la frecuencia tanto alélica como

genotípica• Las causas primarias de los cambios en la diversidad

genética: mutación, migración, recombinación, selección y deriva genética

En resumen

Page 68: Medidas de la Diversidad Genética

45

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 45

f Las definiciones básicas empleadas en la genética de poblaciones

f El principio de Hardy-Weinberg

f La manera de calcular las frecuencias alélicas a partir de los datos de los marcadores

f El efecto de los sistemas de apareamiento en la diversidad de una población

f Las principales fuentes de variación y sus consecuencias

Hasta el momento, usted debería saber …

Page 69: Medidas de la Diversidad Genética

Si desea leer más …de Vicente, M.C. y T. Fulton. 2004. Tecnologías de Marcadores Moleculares para

Estudios de Diversidad Genética de Plantas. <clic aquí>

Doolittle, D.P. 1987. Population Genetics: Basic Principles. Springer-Verlag, Berlín.

Falconer, D.S. y T.F.C. Mackay (eds.). 1996. Introduction to quantitative genetics (4th edn.). Longman Group, Londres.

Griffiths, A.J.F., J.H. Miller, D.T. Suzuki, R.C. Lewontin y W.M. Gelbart (eds.). 1996. An Introduction to Genetic Analysis (6th edn.). Freeman and Co., NY.

Hartl, D.L. 1988. A Primer of Population Genétics (2nd edn.). Sinauer Associates, Sunderland, MA.

Hedrick, P.W. 1985. Genetics of Populations. Jones and Barlett Publishers, Boston, MA.

Snedecor, G.W. y W.S. Cochran (eds.). 1980. Statistical Methods (7th edn.). Iowa State University Press, Ames, IO.

Page 70: Medidas de la Diversidad Genética

Apéndice 1 de: Conceptos Básicos de la Genética de Poblaciones

Valores críticos de la distribución Chi-cuadrado

D Q 0.05 0.01

1 3.84 6.64 2 5.99 9.21 3 7.81 11.34 4 9.49 13.28 5 11.07 15.09

6 12.59 16.81 7 14.07 18.48 8 15.51 20.09 9 16.92 21.67

10 18.31 23.21

11 19.68 24.72 12 21.03 26.22 13 22.36 27.69 14 23.68 29.14 15 25.00 30.58

16 26.30 32.00 17 27.59 33.41 18 28.87 34.80 19 30.14 36.19 20 31.41 37.57

21 32.67 38.93 22 33.92 40.29 23 35.17 41.64 24 36.41 42.98 25 37.65 44.31

26 38.88 45.64 27 40.11 46.96 28 41.34 48.28 29 42.56 49.59 30 43.77 50.89

Page 71: Medidas de la Diversidad Genética

47

Derechos de Autor: IPGRI y Cornell University, 2004 Genética de poblaciones 47

f Medida de la diversidad genética

f Programas informáticos para el análisis de la diversidad genética

f Glosario

A continuación

Page 72: Medidas de la Diversidad Genética

Apéndice 1 de: Conceptos Básicos de la Genética de Poblaciones

Valores críticos de la distribución Chi-cuadrado

D Q 0.05 0.01

1 3.84 6.64 2 5.99 9.21 3 7.81 11.34 4 9.49 13.28 5 11.07 15.09

6 12.59 16.81 7 14.07 18.48 8 15.51 20.09 9 16.92 21.67

10 18.31 23.21

11 19.68 24.72 12 21.03 26.22 13 22.36 27.69 14 23.68 29.14 15 25.00 30.58

16 26.30 32.00 17 27.59 33.41 18 28.87 34.80 19 30.14 36.19 20 31.41 37.57

21 32.67 38.93 22 33.92 40.29 23 35.17 41.64 24 36.41 42.98 25 37.65 44.31

26 38.88 45.64 27 40.11 46.96 28 41.34 48.28 29 42.56 49.59 30 43.77 50.89

Page 73: Medidas de la Diversidad Genética

Apéndice 2 de: Medidas de la Diversidad Genética

Análisis de la varianza molecular: Ejemplo 1 Este modelo, denominado también AMOVA, mide la diversidad génica entre poblaciones, en este caso particular en áreas de una región, en un continente (situación 3, diapositiva 26). Tenemos: i = individuos, j = alelos, k = poblaciones

Yki(j) = Y + ak + bk(i) + wki(j) Donde,

Yki(j) = un valor entre 0 y 1 para el j-ésimo alelo del i-ésimo individuo de la k-ésima población

A(k) = el efecto de la k-ésima población, con varianza V2a Bk(i) = el efecto del i-ésimo individuo dentro de la k-ésima población, con

varianza V2b Wki(j) = el efecto del j-ésimo locus del i-ésimo individuo de la k-ésima

población, con varianza V2w n = el producto de i, j y k; es decir, el número total de observaciones

Fuente de variación gl SC CM CME Entre problaciones (k – 1) 6X...k2/ij – X…2/ijk CMa V2w + 2V2b + 2nV2aEntre individuos/pobl. k(i – 1) 66Xi...k2/j – 6...k2/ij CMb V2w + 2V2b Dentro de individuos ki(j – 1) 666Xijk2 – 66Xi...k2/j CMw V2w Total kij – 1 666Xijk2 – X…2/ijk

Estimaciones de la varianza y de estadísticos F V2a = FSTV

2 FIT = (V2a + V2b)/V2

V2b = (FIT – FST)V2 FST = V2a/V2

V2w = (1 – FIT)V2 FIS = V2b/(V2b + V2w)

V2 = V2w + V2b + V2a Donde,

V2a = el valor paramétrico de la varianza entre poblaciones que portan alelos idénticos. Se estima por (CMa – CMb)/2n.

V2b = el valor paramétrico de la varianza entre individuos dentro de cada población. Se estima por (CMb – CMw)/2.

V2w = el valor paramétrico de la varianza dentro de individuos o la medida de la probabilidad de que los alelos dentro de los loci sean diferentes. Se estima por el cuadrado medio dentro de individuos (CMW).

Page 74: Medidas de la Diversidad Genética

Apéndice 3 de: Medidas de la Diversidad Genética

Análisis de la varianza molecular: Ejemplo 2 Como se describe en el Apéndice 2, este modelo (AMOVA) mide la diversidad génica entre poblaciones, esta vez con referencia específica a las poblaciones dentro de un área de una región, en un continente (situación 4, diapositiva 26). Tiene un nuevo nivel jerárquico (región), con sus respectivos valores paramétricos y estimadores de los cuadrados medios. Tenemos: i = individuos, j = alelos, k = poblaciones, l = regiones

Ylki(j) = Y + rl + al(k) + blk(i) + wlki(j)Donde,

Ylki(j) = un valor entre 0 y 1 para el j-ésimo alelo del i-ésimo individuo de la k-ésima población, en la l-ésima región

rl = el efecto de la l-ésima región, con la varianza V2r al(k) = el efecto de la k-ésima población con la l-ésima región, con

varianza V2a blk(i) = el efecto del i-ésimo individuo dentro de la k-ésima población en

la l-ésima región, con varianza V2b wlki(j) = efecto del j-ésimo locus dentro del i-ésimo individuo de la

k-ésima población, de la l-ésima región, con varianza V2c n = el producto de i, j, k y l, que es el número total de observaciones

Fuente de variación gl CM CME Entre regiones l – 1 CMr V2w + 2V2b + 2nV2a + 2nlV2r Entre pobl., dentro de regiones l(k – 1) CMa V2w + 2V2b + 2nV2a Entre indiv./pobl./regiones Ik(i – 1) CMb V2w + 2V2b Dentro de individuos lki(j – 1) CMw V2w Total Ikij – 1

Varianza total (%) %V2r = (V2r/V2) 100 %V2a = (V2a /V2) 100

V2 = V2r + V2w + V2b + V2a %V2b = (V2b /V2) 100 %V2w = (V2w /V2) 100 V2r es el valor paramétrico de la varianza entre regiones y se estima por (CMA – CMB)/2nl. En las estimaciones de la varianza se agrega el signo ‘%’ porque podemos expresar la varianza calculada para cada fuente (región, población dentro de una región, individuos dentro de una población) en función de la varianza total y, como tal, podemos determinar cuál de los componentes de la variación es el más importante. Por ejemplo, si el valor de la variación originada por las regiones fue alto y los valores de las demás fuentes fueron bajos, podríamos concluir que las poblaciones dentro de las regiones tienen frecuencias alélicas homogéneas, pero que las poblaciones procedentes de diferentes regiones difieren marcadamente en sus frecuencias alélicas.

Page 75: Medidas de la Diversidad Genética

Apéndice 4 de: Medidas de la Diversidad Genética

Distancia geométrica Variables cuantitativas La distancia geométrica, conocida también como distancia taxonómica (Sokal, 1961), se mide mediante distancias euclidianas, según la fórmula que aparece a continuación:

dij = [6k(Xik – Xjk)2]1/2

Donde,

Xik = el valor de la k-ésima variable del i-ésimo individuo Consulte el Apéndice 5 si quiere ver un ejemplo de cómo de calcula esta distancia. Variables mixtas Si hay variables mixtas, primero deben ser transformadas o estandarizadas, según la fórmula que aparece a continuación:

i

iijijstand s

X-XX Donde,

Xij = el valor del i-ésimo carácter en el j-ésimo individuo CXi = el promedio para el i-ésimo carácter si = la desviación estándar para el i-ésimo carácter

Número P de variables Si hay un número P de variables, el valor de la distancia para que se vuelva independiente del número de variables, como se muestra a continuación:

P

)X-(Xd

2

k k

jkik

2ij

¦ »¼º

«¬ª

ı

Referencia Sokal, R. 1961. Distance as a measure of taxonomic similarity. Syst. Zool.

10(2):40-51.

Page 76: Medidas de la Diversidad Genética

Apéndice 5 de: Medidas de la Diversidad Genética

Transformación de datos a partir de variables cuantitativas: Un ejemplo Tenemos tres caracteres tomados en cuatro individuos:

• Altura de la planta (m) • Peso de la semilla (g) • Diámetro del grano de polen (µ)

Antes de calcular las distancias, primero debemos estandarizar los datos mediante la siguiente fórmula:

Mestand = m -Cm/V Después de la estandarización, se pierden las unidades de medida.

m Mestand g gestand µ µestand

Individuo 1 1.50 0.35 0.02 0.00 80.00 -0.15 Individuo 2 1.20 -1.41 0.03 1.00 70.00 -1.32 Individuo 3 1.45 0.06 0.01 -1.00 90.00 1.02 Individuo 4 1.60 0.94 0.02 0.00 85.00 0.44 Promedio (Xi) 1.44 � 0.02 � 81.25 �

Desviación (si) 0.17 � 0.01 � 8.54 �

Ahora se pueden calcular las distancias para cualquier par de individuos, aplicando la fórmula que ya conocemos:

dij = [6(Xij – Xkj)2]1/2

d12 = [(0.35 – (-1.41))2 + (0.0 – 1.0)2 + (-0.15 – (-1.32))2]1/2 = 2.34 d11 = 0 d13 = [(0.35 – 0.06)2 + (0.0 – (-1.0))2 + (-0.15 – 1.02)2]1/2 = 1.57 d22 = 0 d14 = [(0.35 – 0.94)2 + (0.0 – 0.0)2 + (-0.15 – 0.44)2]1/2 = 0.83 d33 = 0 d23 = [(-1.41 – 0.06)2 + (1.0 – (-1.0))2 + (-1.32 – 1.02)2]1/2 = 3.41 d44 = 0 d24 = [(-1.41 – 0.94)2 + (1.0 – 0.0)2 + (-1.32 – 0.44)2]1/2 = 3.10 d34 = [(0.06 – 0.94)2 + (-1.0 – 0.0)2 + (1.02 – 0.44)2]1/2 = 1.45

Después de obtener las distancias dos a dos, procedemos a encontrar los grupos utilizando el método UPGMA (para más detalles, ver diapositivas 58 y 59 del módulo).

Page 77: Medidas de la Diversidad Genética

En primer lugar, organizamos en un cuadro simétrico nuestros valores de distancia calculados:

I1 I2 I3 I4

I1 0

I2 2.34 0

I3 1.57 3.41 0

I4 0.83 3.10 1.45 0 En el primer ciclo, escogemos la distancia más corta. En nuestro caso es d1,4 = 0.83. Después se puede elaborar una nueva matriz agrupando el Individuo1 con el Individuo4 y calculando las distancias combinadas:

d2(1,4) = (d1,2 + d2,4)/2 = (2.34 + 3.10)/2 = 2.72 d3(1,4) = (d1,3 + d3,4)/2 = (1.57 + 1.45)/2 = 1.51

I1,4 I2 I3

I1,4 0

I2 2.72 0

I3 1.51 3.41 0 Observamos ahora que la distancia más corta está entre I1,4 y I3. En un nuevo ciclo, se elabora una nueva matriz, agrupando el Individuo2 con el grupo I(1,4)3 y calculando la distancia combinada d((1,4)3)2 = 3.07.

I1,4(3) I2

I1,4(3) 0

I2 3.07 0 Con base en los resultados que aparecen arriba, podemos proceder a trazar el dendrograma, relacionando los cuatro individuos del ejemplo:

Page 78: Medidas de la Diversidad Genética

3.00 0.02.00 1.001.50

1

4

3

2

Page 79: Medidas de la Diversidad Genética

Apéndice 6 de: Medidas de la Diversidad Genética

Aplicación del coeficiente de concordancia simple a los caracteres morfológicos (variables categóricas) Tenemos tres caracteres:

• Pubescencia foliar: escasa (1), común (2), abundante (3) • Color de los pétalos: blanco (1), amarillo (2), rojo (3) • Longitud del pecíolo: corto (1), intermedio (2), largo (3)

En primer lugar, convertimos los datos de las medidas en datos binarios. Obsérvese que los tres caracteres originales se convierten en 9 caracteres binarios. Esta operación podría darle demasiada importancia a estos caracteres, en detrimento de otros que se empleen en el análisis.

Carácter 1 Carácter 2 Carácter 3

UTO 1 2 1 2

UTO 2 2 3 3

UTO 3 1 2 1

UTO 4 3 3 1

Carácter 1 (código binario)

Carácter 2 (código binario)

Carácter 3 (código binario)

Escaso Común Abundante Blanco Amarillo Rojo Corto Intermedio Largo

UTO 1 0 1 0 1 0 0 0 1 0

UTO 2 0 1 0 0 0 1 0 0 1

UTO 3 1 0 0 0 1 0 1 0 0

UTO 4 0 0 1 0 0 1 1 0 0 Luego, aplicamos el coeficiente de concordancia simple para calcular las distancias dos a dos entre individuos:

Comparaciones dos a dos para todos los caracteres

UTO 1 vs. 2 1 0 UTO 1 vs. 3 1 0 UTO 1 vs. 4 1 0

1 a = 1 b = 2 1 a = 0 b = 3 1 a = 0 b = 3

0 c = 2 d = 4 0 c = 3 d = 3 0 c = 3 d = 3

UTO 2 vs. 3 1 0 UTO 2 vs. 4 1 0 UTO 3 vs. 4 1 0

1 a = 0 b = 3 1 a = 1 b = 2 1 a = 1 b = 2

Page 80: Medidas de la Diversidad Genética

0 c = 3 d = 3 0 c = 2 d = 4 0 c = 2 d = 4

Ahora, podemos proceder con el método para encontrar los grupos y dibujar el fenograma correspondiente:

O1 O2 O3 O4

O1 0

O2 0.56 0

O3 0.33 0.33 0

O4 0.33 0.56 0.56 0

Coeficiente

0.25 0.44 0.81 1.00

1

2

3

4

Fenograma

0.63

Page 81: Medidas de la Diversidad Genética

Apéndice 7 de: Medidas de la Diversidad Genética

Cálculo de la distancia genética de Nei En primer lugar, elaboramos la matriz de distancia con los datos obtenidos en el ejemplo (ver diapositiva 48), de la siguiente manera:

P1 P2 P3

P1 0

P2 0.0852 0

P3 0.0107 0.0440 0

En el primer ciclo, escogemos la distancia más corta: d1,3 = 0.0107. En el segundo ciclo, se elabora una nueva matriz agrupando el Individuo1 con el Individuo4 y calculando las distancias combinadas:

d2(1,3) = (d1,2 + d2,3)/2 = (0.0852 + 0.044)/2 = 0.0646 Ahora podemos dibujar el dendrograma:

P1,3 P2

P1,3 0

P2 0.0646 0

0.07 0.04 0.05 0.06 0.03 0.08 0.0 0.01 0 .02

1

3

2

Page 82: Medidas de la Diversidad Genética

Apéndice 8 de: Medidas de la Diversidad Genética

Similitudes morfológicas y moleculares

Individuo2Individuo1 Individuo3

ADN

2 1 3 4 5

6 7 8

9 10

11 12

9 + 10

7 + 8 6

1 1

9 10

1211

8

5 21 3 4

6

22

7

5 3 + 4 2

1211

Digamos que tenemos tres rosas individuales (1, 2, 3). Morfológicamente, los números 2 y 3 se parecen, en tanto que el número 1 se ve diferente. Si observamos los fragmentos de ADN, generados supuestamente con un marcador molecular, vemos que los individuos 2 y 3 parecen ser más similares. Entonces, ¿qué sucedió? Esto apunta a la importancia de estudiar la diversidad genética en todos los niveles posibles. La combinación de información procedente de diferentes tipos de marcadores —es decir, los de los genes funcionales y aquellos que muestran polimorfismo en regiones genómicas— proveerá la mejor aproximación posible al conocimiento sobre la variación genética presente. Se aplicaría el mismo principio si pudiéramos combinar datos morfológicos y moleculares. En este Apéndice señalamos el tipo de errores en que podemos incurrir si las conclusiones se basan solamente en un tipo de datos de marcadores.

Page 83: Medidas de la Diversidad Genética

a = 11 b = 1

c = 2 d = 3Indi

v. 1

Indiv. 2 Con base en el perfil de bandas de ADN obtenido en el gel para los tres individuos, se calculan las distancias dos a dos, utilizando el coeficiente de Jaccard: Luego, elaboramos la matriz de distancia y dibujamos el dendrograma:

Ind1 Ind2 Ind3

Ind 1

1

Ind 2

0.786 1

Ind 3

0.400 0.294 1

Ind12 Ind3

Ind 12

1

Ind 3

0.347 1

cba

aJ

� �

a = 5 b = 8

c = 4 d = 0Indi

v. 2

Indiv. 3

a = 6 b = 6

c = 3 d = 2Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

67

9

10

1112

1

22

2

3+4

7+8

9+10

a = 11 b = 1

c = 2 d = 3Indi

v. 1

Indiv. 2

a = 5 b = 8

c = 4 d = 0Indi

v. 2

Indiv. 3

a = 6 b = 6

c = 3 d = 2Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

67

9

10

1112

1

22

2

3+4

7+8

9+10

0.7862111

111,2

�� 0.400

3666J1, 3 ��

0.294485

5J2,3 ��

J

0.342

S 2S1,3 S 1,2,

,3

3

� 1,3 2,3 S1,2,3

S S���

20.347

Page 84: Medidas de la Diversidad Genética

Este dendrograma se obtuvo a partir de los datos moleculares. Ahora, podemos compararlo con otro dendrograma que aparece a continuación, que fue obtenido a partir de observaciones morfológicas, y ver cómo difieren entre sí. Según el dendrograma molecular, los individuos 1 y 2 se encuentran más cercanos entre sí, aun cuando los datos morfológicos indican que los Individuos 2 y 3 son más cercanos. Podemos también usar una combinación de datos moleculares y morfológicos, volviendo a realizar el proceso con ambos datos simultáneamente.

a = 11 b = 2

c = 2 d = 3

In

div.

1

Indiv. 2

a = 6 b = 8

c = 4 d = 0

Indi

v. 2

Indiv. 3

a = 6 b = 7

c = 3 d = 2

Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

6

7

8

9

10

11

12

1

22

2

3+4

7+8

9+10

a = 11 b = 2

c = 2 d = 3

Indi

v. 1

Indiv. 2

a = 6 b = 7

c = 3 d = 2

a = 6 b = 8

c = 4 d = 0

Indi

v. 2

Indiv. 3

Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

6

7

8

9

10

11

12

1

22

2

3+4

7+8

9+10

0.0 1.00.8 0.6 0.4 0.2

Ind3

Ind2

Ind1

0.0 1.0

Ind 1 I 1

Ind2

Ind3

Ind1

Dendrograma morfológico

Dendrograma molecular

Page 85: Medidas de la Diversidad Genética

El dendrograma combinado indica distancias de agrupación que difieren del dendrograma molecular y del dendrograma morfológico, considerados por separado. En consecuencia, podemos asumir que la información provista al combinar los datos está más cerca de la realidad de la situación.

733.02211

11J1,2 ��

375.0376

6J1,3 ��

333.0486

6J2,3 ��

Ind3Ind2Ind1

Ind3

Ind2

Ind1 10.733 10.375 0.333 1

Ind3Ind2Ind1

Ind3

Ind2

Ind1 10.733 10.375 0.333 1

1

0.554 1

Ind3Ind12

Ind 3

Ind 1

2

0.5542SSS 2,31,3

(1,2)3 �

1

0.554 1

Ind3Ind12

Ind 3

Ind 1

2

0.5542SSS 2,31,3

(1,2)3 �

Ind1

Ind3

0.2 0.4 0.6 0.8 1.0

Ind2

0.0

Page 86: Medidas de la Diversidad Genética

Apéndice 9 de: Programas Informáticos para el Análisis de la Diversidad Genética

Referencias a los programas informáticos Arlequin Schneider, S., D. Roessli y L. Excoffier. 2000. Arlequin: A Software for Population

Genetics Data Analysis, Versión 2.000. Laboratorio de Genética y Biometría, Dept. de Antropología, Universidad de Ginebra, Suiza.

CLUSTAL W Thompson, J.D., D.G. Higgins y T.J. Gibson. 1994. CLUSTAL W: improving the

sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22:4673-4680.

DnaSP Rozas, J. y R. Rozas. 1995. DnaSP, DNA sequence polymorphism: an interactive

program for estimating population genetics parameters from DNA sequence data. Comput. Appl. Biosci. 11:621-625.

GDA Lewis, P.O. y D. Zaykin. 1999. Genetic Data Analysis: Computer Program for the

Analysis of Allelic Data, Versión 1.0 (d12). Distribuido por los autores. GENEPOP Raymond, M. y F. Rousset. 1995. GENEPOP (versión 1.2): Population genetics

software for exact tests and ecumenicism. J. Hered. 86:248-249. GeneStrut Constantine, C.C., R.P. Hobbs y A.J. Lymbery. 1994. FORTRAN programs for

analysing population structure from multilocus genotype data. J. Hered. 85:336-337.

MacClade Maddison, D.R. y W.P. Maddison. 2000. MacClade. Versión 4. Sinauer

Associates, Sunderland, MA. MALIGN Janies, D. y W.C. Wheeler. 1998. MALIGN.pdf: Documentation for MALIGN,

software for multiple alignments of DNA sequences. Distribuido por los autores en la Internet en <ftp://ftp.amnh.org/pub/molecular/malign/>.

Page 87: Medidas de la Diversidad Genética

MEGA2 Kumar, S., K. Tamura, I.B. Jakobsen y M. Nei. 2001. MEGA2: Molecular

Evolutionary Genetics Analysis software. Bioinformatics 17(12):1244-1245. NTSYSpc Rohlf, F.J. 2002. NTSYS pc: Numerical Taxonomy System, Version 2.1. Exeter

Publishing, Setauket, NY. PAUP* Swofford, D.L. 2002. PAUP*: Phylogenetic Analysis Using Parsimony (*and Other

Methods), Versión 4. Sinauer Associates, Sunderland, MA. PHYLIP Felsenstein, J. 1993. PHYLIP (Phylogeny Inference Package), Versión 3.5c.

Distribuido por el autor. POPGENE Yeh, F.C., R.C. Yang, T.B.J. Boyle, Z.H. Ye y J.X. Mao. 1997. POPGENE, the

User-Friendly Shareware for Population Genetic Analysis. Centro de Biología Molecular y Biotecnología, Universidad de Alberta, Canadá.

PowerMarker Liu, J. 2003. PowerMarker: New Genetic Data Analysis Software, Versión 1.0.

Programa distribuido por el autor en forma gratuita en la Internet en <http://www.powermarker.net>

SITES Hey, J y J. Wakeley. 1997. A coalescent estimator of the population

recombination rate. Genetics 145:833-846. structure Pritchard, J.K., M. Stephens y P. Donnelly. 2000. Inference of population

structure using multilocus genotype data. Genetics 155:945-959. TFPGA Miller, M.P. 1997. Tools for Population Genetic Analysis (TFPGA), 1.3: A

Windows Program for the Analysis of Allozyme and Molecular Population Genetic Data. Distribuido por el autor.

Page 88: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 1

Medidas de la diversidad genética

Análisis de la diversidad genética utilizando datos de marcadores moleculares:

Módulo de aprendizaje

Page 89: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 2

f Análisis básico de la diversidad genéticaf Tipos de variablesf Cuantificación de la diversidad genética:

• Medidas de la diversidad genética dentro de una población

• Medidas de la diversidad genética entre poblaciones

f Cuantificación de las relaciones genéticas:• Diversidad y diferenciación a nivel de nucleótido• Distancia genética

f Visualización de las relaciones:• Clasificación o agrupación• Ordenación

f Apéndices

Contenido

Page 90: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 3

1. Descripción de la variación dentro de poblaciones, regiones, etc. y entre ellas

2. Evaluación de las relaciones entre individuos, poblaciones, regiones, etc.

3. Expresión de las relaciones entre los resultados obtenidos con diferentes tipos de caracteres

Ind5

Ind3

Ind6Ind4Ind2Ind1

Análisis básico de la diversidad genética

00.460.370.560.560.330600.280.370.430.3205

00.500.260.470400.330.3303

00.5602001

060504030201

Datos

de 000111

110101

001100110001010110110001101101

marcadores

Individuos

La mayoría de los análisis de diversidad genética en los que podríamos estar interesados incluiría los siguientes pasos:

1. La descripción de la diversidad. Esto se puede hacer dentro de una población o entre poblaciones. También puede extenderse a unidades más grandes como zonas y regiones.

2. El cálculo de las relaciones entre las unidades analizadas en el paso uno. Esto implica el cálculo de las distancias (geométrica o genética) entre todos los pares de clases analizadas en el estudio.

3. La expresión de estas relaciones con cualquier método de ordenación y/o clasificación disponible. Algunos de estos métodos permitirán comparar los resultados de nuestro estudio molecular con otros tipos de datos (por ejemplo, geográficos). En la diapositiva, los Ind1, Ind2, … pueden representar poblaciones o regiones, en vez de individuos.

Page 91: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 4

f Cualitativas. Se refieren a caracteres o cualidades, y son binarias o categóricas:

• Binarias, cuando reciben solamente dos valores: presente (1) o ausente (0)

• Categóricas, cuando reciben un valor entre varias posibilidades y pueden ser ordinales o nominales:

� Ordinales: categorías que tienen un orden� Nominales: categorías que no tienen relación

entre síf Cuantitativas. Son numéricas y pueden ser

continuas o discretas:• Continuas, cuando toman un valor dentro de un

rango dado• Discretas, cuando toman números enteros o

decimales

Tipos of variables

Ejemplos de variables cualitativas:• Binarias: p. ej., pubescencia foliar: presente (1), ausente (0)• Categóricas:

� Ordinales: p. ej., pubescencia caulinar: escaso (1), común (2), abundante (3), o

longitud del pecíolo: corto (1), intermedio (2), largo (3)� Nominales: p. ej., color de los pétalos: amarillo (1), rojo (2), blanco (3),

púrpura (4)

Ejemplos de variables cuantitativas:• Continuas: p. ej., peso de la raíz (g); longitud de la hoja (cm)• Discretas: p. ej., número de estambres: 2, 3, 4, …

número de frutos: 1, 2, 3, …

Las variables categóricas pueden convertirse en variables binarias; sin embargo, existen algunas limitaciones puesto que, como veremos, algunos coeficientes de similitud le dan mayor importancia a la categoría de algún carácter determinado, lo que puede generar un sesgo en contra de otros caracteres que se estén evaluando. Es decir, cuántas más categorías tenga una variable, más importancia tendrá cuando se combine con otras variables binarias o categóricas que tengan pocas categorías.

A continuación presentamos un ejemplo de conversión de una variable categórica en una binaria:

Longitud del pecíolo: corto (1), intermedio (2), largo (3)� Corto: presente (1), ausente (0)� Intermedio: presente (1), ausente (0)� Largo: presente (1), ausente (0)

Las variables cuantitativas también se pueden convertir en variables binarias, p.e.: De 0 a 3 frutos: presente (1), ausente (0)De 4 a 7 frutos: presente (1), ausente (0), ...

Page 92: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 5

Cuantificación de la diversidad genética: Medida de la diversidad genética intrapoblacional

f Con base en el número de variantes• Polimorfismo o tasa de polimorfismo (Pj)• Proporción de loci polimórficos• Abundancia de variantes alélicas (A)• Número promedio de alelos por locus

f Con base en la frecuencia de variantes• Número efectivo de alelos (Ae)• Heterocigosidad esperada (He; diversidad genética

de Nei)

Page 93: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 6

Un gen se define como polimórfico si la frecuencia de uno de sus alelos es menor o igual a 0.95 ó0.99

Pj = q � 0.95 o Pj = q � 0.99

Polimorfismo o tasa de polimorfismo (Pj)

Donde,Pj = tasa de polimorfismoq = frecuencia alélica

• Esta medida proporciona el criterio para determinar si un gen presenta variación.

• Su cálculo se hace por observación directa respecto a si se cumple la definición o no se cumple.

• La medida puede usarse con marcadores codominantes y, de manera muy restrictiva, con marcadores dominantes, debido a que la estimación basada en los marcadores dominantes presentaría una tendencia al sesgo inferior al número real.

Por lo general, un gen polimórfico es aquel para el cual el alelo más común tiene una frecuencia de menos de 0.95. Los alelos raros o poco comunes se definen como aquellos cuyas frecuencias son menores a 0.005. El límite de la frecuencia alélica, que se fija en 0.95 (ó 0.99) es arbitrario, y su objetivo es ayudar a identificar aquellos genes en los cuales es común la variación alélica.

Referencia

Cavalli-Sforza, L. L. y W. F. Bodmer. 1981. Genética de las Poblaciones Humanas. Ed. Omega, Barcelona.

Page 94: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 7

Es el número de loci polimórficos dividido por el número total de loci (polimórficos y monomórficos), es decir:

P = npj/ntotal

Proporción de loci polimórficos

Donde,P = la proporción de loci polimórficosnpj = el número de loci polimórficosntotal = el número total de loci

• Expresa el porcentaje de loci variables en una población.

• Su cálculo se basa en el conteo directo de los loci polimórficos y totales.

• Puede usarse con marcadores codominantes y, de manera muy restrictiva,con marcadores dominantes (ver la diapositiva anterior para la explicación).

Page 95: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 8

f Se refiere al número de variantes en una muestra

f La medida de la diversidad es (A - 1) variantes porque, dentro de una población monomórfica, el grado de diversidad es cero (A - 1 = 0)

Abundancia de variantes alélicas (A)

• Para un gen dado en una muestra, esta medida indica cuántas variantes alélicaspueden encontrarse.

• Es sensible al tamaño de la muestra.

• Aunque la distribución de alelos no afecta, el número máximo de alelos sí es importante.

• La medida solamente puede aplicarse con marcadores codominantes.

Page 96: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 9

� �¦

K

1iin1/K n

Número promedio de alelos por locus

Es la suma de todos los alelos detectados en todos los loci, dividido por el número total de loci

Donde,K = el número de locini = el número de alelos detectados por locus

• Esta medida brinda información complementaria a la información sobre polimorfismo.

• Requiere únicamente el conteo del número de alelos por locus y luego, el cálculo del promedio.

• Se aplica mejor a marcadores codominantes, dado que los dominantes no permiten la detección de todos los alelos.

Page 97: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 10

Número efectivo de alelos (Ae)

Es el número de alelos que pueden estar presentes en una población

Ae = 1/(1 – h) = 1/Ȉpi2

Donde,pi = frecuencia del i-ésimo alelo en un locus h = 1 – Ȉpi

2 = heterocigosidad en un locus

• Indica el número de alelos que se esperaría en un locus, en cada población.

• Se calcula invirtiendo la medida de la homocigosidad en un locus.

• Puede utilizarse con datos de marcadores codominantes.

• Su cálculo puede verse afectado por el tamaño de la muestra.

Esta medida de diversidad puede proporcionar información útil para establecer estrategias de colecta. Por ejemplo, estimamos el número efectivo de alelos en una muestra. Luego, la comprobamos en una muestra diferente o en toda la colección. Si la cifra obtenida la segunda vez es menor que la primera, esto podría significar que nuestra estrategia de colecta necesita revisión.

Page 98: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 11

�0.30����Frecuencia del alelo 4

2.00

0.50

0.500.50

2A1 A2

A2 A2

A2 A2

A1 A1

A1 A1

Población 2

3.33

0.70

0.200.100.40

4B4 B4

B1 B1

B1 B4

B2 B3

B1 B3

1.002.942.172.17Número efectivo de alelos

0.000.660.540.54Heterocigosidad (h)

0.000.400.300.30Frecuencia del alelo 30.000.300.100.10Frecuencia del alelo 21.000.300.600.60Frecuencia del alelo 1

1333Número de alelosC1 C1C3 C3B3 B3A3 A3Individuo 5C1 C1C2 C3B1 B3A1 A3Individuo 4C1 C1C1 C3B1 B1A1 A1Individuo 3C1 C1C2 C2B1 B2A1 A2Individuo 2C1 C1C1 C1B1 B1A1 A1Individuo 1

Población 1Loci (A, B, C)

Cálculo de Ae: Un ejemplo

El cuadro que aparece en esta diapositiva presenta un ejemplo de cómo calcular el número efectivo de alelos. Cada una de las dos poblaciones tiene 5 individuos. Para cada individuo, se analizan 3 loci, cada uno con un número diferente de alelos, dependiendo de la población (el locus A tiene 3 alelos en la población 1 y sólo 2 alelos en la población 2, y así sucesivamente). Primero se calculan las frecuencias alélicas para cada locus y para cada población. Luego se calcula la heterocigosidad en cada locus y, por último, el número efectivo de alelos, Ae, de acuerdo con la fórmula que aparece en la diapositiva anterior.

Page 99: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 12

f Es la probabilidad de que, en un locus único, cualquier par de alelos, escogidos al azar de la población, sean diferentes entre sí

f Tres cálculos son posibles:• Un locus con dos alelos: hj = 1 – p2 – q2

• Un locus j con i alelos: hj = 1 – Ȉpi2

• Promedio para varios loci: H = ȈjLhj/L

f La He promedio de todos los loci es una estimación del grado de variabilidad genética en la población

Heterocigosidad promedio esperada (He) (diversidad genética de Nei [D])

Donde,hj = la heterocigosidad por locusp y q = las frecuencias alélicasH = la heterocigosidad promedio para varios lociL = el número total de loci

• La heterocigosidad promedio esperada se calcula al restar de 1 las frecuencias esperadas de homocigotos en un locus. La operación se repite para todos los loci y luego se saca el promedio.

• Puede aplicarse con todos los marcadores, ya sean codominantes o dominantes.

• El valor calculado puede verse afectado por aquellos alelos presentes en frecuencias mayores.

• Varía de 0 a 1.

• Se maximiza cuando hay muchos alelos cuyas frecuencias son iguales.

• Debe analizarse un mínimo de 30 loci en 20 individuos por población, para reducir el riesgo de sesgo estadístico.

Page 100: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 13

Cálculo de la diversidad con un marcador molecular codominante

Individuos

Locus A

Locus B

Locus E

Locus C

Locus D

M 1 2 3 4 5 6 7 8 9 10Gel

11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

Lectura de datos

Locus ALocus B

Locus E

Locus CLocus D

1,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 1,1 0,1 0,1 0,1

M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 1,0 1,0 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 1,1 0,1 1,0 1,0 1,0 1,1

1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

0,1 1,1 0,1 1,1 0,1 1,0 1,1 1,0 1,1 1,1 1,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 0,1 0,1 1,0 1,0 1,0 1,0 1,0 1,1 1,1 0,1 0,1

(continúa en la siguiente)

En la mitad superior de esta diapositiva aparece un dibujo de un gel con un marcador de tamaño a la izquierda (M) y 30 individuos analizados con un marcador codominante, que detectó cinco loci (A, B, C, D y E). De estos loci, solamente tres son polimórficos (A, B y E).

En la mitad inferior de la diapositiva aparecen los resultados de la lectura de bandas, por individuo y por locus. Obsérvese que, para facilitar la presentación, no se ilustraron más de dos alelos por locus. Aunque las bandas que pertenecen a los loci C y D fueron registradas como (1,0) para todos los individuos, la lectura no hubiera sido necesaria puesto que las bandas no dieron información de diversidad.

Los cálculos se presentan en la siguiente diapositiva.

Page 101: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 14

0.22

Hi

0.46

0.41

0.23

hj = (1 - p2 - q2)

0.37

q

0.72

q

0.87

q

0.63

p

0.28

p

0.13

p

Frecuencia alélica

1

30

1

Total

1

30

1

Total

1

30

1

Total

E2 E2E1 E2E1 E1Genotipos

Eq22pqp2Frecuencia genotípica (esp.)

7815Individuos (no.)

P22 = 0.23P12 = 0.27P11 = 0.50Frecuencia genotípica (obs.)

B2 B2B1 B2B1 B1Genotipos

Bq22pqp2Frecuencia genotípica (esp.)

2037Individuos (no.)

P22 = 0.67P12 = 0.10P11 = 0.23Frecuencia genotípica (obs.)

P22 = 0.80P12 = 0.13P11 = 0.07Frecuencia genotípica (obs.)

Análisis de datosLocus

2

p2

A1 A1

244Individuos (no.)

q22pqFrecuencia genotípica (esp.)

A2 A2A1 A2Genotipos

A

Cálculo de la diversidad con un marcador molecular codominante (continuación)

1. En primer lugar, observamos que los loci A, B y E son polimórficos porque satisfacen el requisito de tener frecuencias alélicas por debajo de 0.99. Los lociC y D son monomórficos (esp. = valor esperado; obs. = valor observado).

2. La proporción de loci polimórficos es de P = (3/5) = 0.6 ó 60%. Es decir, el número de loci polimórficos se divide por el número total de loci analizados.

3. Para calcular la heterocigosidad promedio (Ho), se procede de la siguiente manera:

a. Contamos el número de loci, del total, que son heterocigotos. Por ejemplo, el Individuo1 tiene un locus heterocigoto (A), el Individuo2también (E); el Individuo27 tiene 2 loci heterocigotos (A y E), ... . En total, 16 individuos fueron monomórficos (es decir, tenían únicamente una banda en cada uno de los cinco loci), 13 individuos tenían 1 locus heterocigótico y 1 individuo tenía 2 loci heterocigóticos.

b. Calculamos la heterocigosidad promedio observada, de la siguiente manera:

Ho = [16(0/5) + 13(1/5) + 1(2/5)]/(30) = 0.1

4. La diversidad génica dentro de un locus (hj) se calcula para cada locus, de acuerdo con la fórmula que aparece en la fila superior del cuadro, lo que nos da los siguientes resultados: locus A = 0.23, locus B = 0.41 y locus E = 0.46.

5. La diversidad génica promedio esperada (Hi) se calcula a partir de la fórmula que aparece en la diapositiva número 12:

Hi = (0.23 + 0.41 + 0.46)/5 = 0.22

Page 102: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 15

Locus ALocus B

Locus E

Individuos

Locus CLocus D

M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

Lectura de datos

1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0

M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 24 25 26 27 28 2920 30

0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 1 0 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 0 0

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Locus ALocus B

Locus E

Locus CLocus D

Cálculo de la diversidad con un marcador molecular dominante

(continúa en la siguiente)

En la mitad superior de esta diapositiva aparece un dibujo de un gel (marcador de tamaño a la izquierda, M) con 30 individuos analizados con un marcador dominante. Se identifican cinco loci (A, B, C, D y E), de los cuales tres están segregando (A, B y E), en tanto que los otros dos, C y D, son monomórficos.

En la mitad inferior de la diapositiva están los resultados de la lectura de bandas, por individuo y por locus. Como se trata de un marcador dominante, a las bandas presentes se les asigna un 1 y a las ausentes un 0. La lectura de las bandas para los loci C y D puede omitirse o bien atribuirles un 1 a todos, como aparece en la diapositiva.

Los cálculos figuran en la siguiente diapositiva.

Page 103: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 16

0.198

Hi

0.50

0.30

0.19

hj = (1 - p2 – q2)

0.48

q

0.82

q

0.89

q

0.52

p

0.18

p

0.11

p

Frecuencia alélica

1

30

1

Total

1

30

1

Total

1

30

1

Total

eeEeEEGenotipos

Eq22pqp2Frecuencia genotípica (esp.)

723Individuos (no.)

P2 = 0.23P1 = 0.77Frecuencia genotípica (obs.)

bbBbBBGenotipos

Bq22pqp2Frecuencia genotípica (esp.)

2010Individuos (no.)

P2 = 0.67P1 = 0.33Frecuencia genotípica (obs.)

P2 = 0.80P1 = 0.20Frecuencia genotípica (obs.)

Análisis de datosLocus

6

p2

Aa

24Individuos (no.)

q22pqFrecuencia genotípica (esp.)

aaAaGenotipos

A

Cálculo de la diversidad con un marcador molecular dominante (continuación)

1. En primer lugar, tomamos en consideración el polimorfismo mostrado por todos los loci. Los loci A, B y E satisfacen el requisito de tener frecuencias alélicaspor debajo de 0.99 y, como tales, se puede decir que son polimórficos. Los lociC y D son monomórficos (esp. = valor esperado; obs. = valor observado).

2. La proporción de loci polimórficos (P) es de P = (3/5) = 0.6 ó 60%. No se puede estimar la heterocigosidad promedio (He) porque los marcadores dominantes no permiten discriminar entre individuos heterocigotos y homocigotos.

3. A pesar de lo anterior (2), se puede calcular la diversidad génica dentro de un locus (hj) para cada locus, utilizando la fórmula que aparece en la fila superior del cuadro, columna 4, del siguiente modo: locus A = 0.19; locus B = 0.30; y locus E = 0.50.

4. La diversidad génica promedio (Hi) se calcula a partir de la fórmula que aparece en la diapositiva número 12:

Hi = (0.19 + 0.30 + 0.50)/5 = 0.198

Page 104: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 17

f Diferenciación entre poblaciones respecto a un locus (gST)

f Diferenciación entre poblaciones respecto a varios loci (GST)

f Aporte de la población a la diversidad genética total

f Estadísticos F (Wright)

f Análisis de varianza molecular (AMOVA)

Cuantificación de la diversidad genética: Medida de la diversidad genética entre poblaciones

La ‘diferenciación’ se refiere a las diferencias polimórficas entre las poblaciones, a niveles diferentes de estructura (poblaciones e individuos).

Page 105: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 18

gST = 1 – (hS/hT)

hS = diversidad de la población

hT = diversidad total

Diferenciación entre poblaciones respecto a un locus (gST)

Donde,hS = (ñ/(ñ - 1)[1 – (1/s)¦¦xij

2 – (ho/2ñ)]hT = 1 - ¦[(1/s)¦xij]2 + (hS/ñs) – (ho/2ñs)ñ = el promedio armónico de los tamaños de población s = el número de poblacionesho = la heterocigosidad promedio observadaxij = la frecuencia calculada del i-ésimo alelo en la j-ésima población

• La fórmula que aparece en la diapositiva provee una medida de la diferenciación en función de los alelos por locus, en dos poblaciones o más.

• Varía de 0 a 1. Podría obtenerse un valor negativo si se cometiera un error en el muestreo o si se empleara un tipo de marcadores inapropiado.

• Dada la complejidad de sus componentes, para su cálculo se requieren programas informáticos especializados.

• Puede utilizarse con marcadores codominantes y, con algunas restricciones, con marcadores dominantes debido a que es una medida de la heterocigosidad. Son necesarias varias generaciones para tener una apreciación razonable del valor real.

Page 106: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 19

gST = 1 – (hs/hT) = 1 – (0.4196/0.8065) = 0.4797

hT = 1 – 0.1967 + [0.4196/(33.33 x 3)] – [0.20/(2 x 33.33 x 3)] = 0.8065

�[1/3�xij]2 = (1/3(0.35))2 + (1/3(0.65))2 + (1/3(0.20))2 + … + (1/3(0.35))2 = 0.1967

hs = (33.33/33.33 – 1)[1 – 1/3(1.77) – (0.20/2(33.33))] = 0.4196

ñ = 33.331/ñ = 1/n1 + 1/n2 + 1/n3 = 1/100 + 1/100 + 1/100 = 0.03

�(p2 + q2) = 1.77s = 3ho = 1/3(0.3 + 0.2 + 0.1) = 0.20

0.5450.350.65301060Población 3

0.6800.800.20702010Población 20.5450.650.35503020Población 1

p2 + q2qpA2 A2A1 A2A1 A1Genotipos

Cálculo de gST

En este ejemplo, tenemos el número de individuos para cada genotipo, para un locus (A), en tres poblaciones diferentes. Mediante este número, queremos conocer el grado de diferenciación en las tres poblaciones. En el cuadro, se realizan los cálculos para todos los elementos necesarios en la fórmula que aparece en la diapositiva anterior.

El resultado (gST = 0.4797) muestra que existe una diferenciación significativa entre las poblaciones con respecto a las frecuencias alélicas. En consecuencia, podemos afirmar que un porcentaje alto de la diversidad genética se encuentra distribuido entre las poblaciones.

Page 107: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 20

HS HSDST

Pob1

Pob2

Pob3

HS

DST DSTHT

Diferenciación entre poblaciones respecto a varios loci (GST)

GST es el coeficiente de diferenciación génica

GST = DST/HT

Donde,HT = la diversidad génica total = HS + DST

HS = la diversidad génica dentro de una poblaciónDST = la diversidad entre poblaciones(HT/HT) = (HS/HT) + (DST/HT) = 1

• GST mide la proporción de diversidad génica que está distribuida entre las poblaciones.

• Debe tomarse una muestra de un número suficiente de loci.

• Las ecuaciones son complejas y deben calcularse con programas informáticos específicos.

Por ejemplo, suponiendo que:

HT = 0.263HS = 0.202DST = 0.263 – 0.202 = 0.061

Entonces, GST = (DST/HT) 100 = (0.061/0.263) 100 = 23.19%, lo que significa que, en esta especie, existe una diferenciación del 23% entre las poblaciones.

Page 108: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 21

El aporte se calcula retirando una población del conjunto, de manera que se pueda evaluar su aporte a la diversidad génica total

CT(K) = (HT – HT/K)/HT

CS(K) = (HS – HS/K)/HT

CST(K) = (DST – DST/K)/HT

Aporte de la población a la diversidad génica total

Donde,CT(K) = el aporte de K a la diversidad totalCS(K) = el aporte de K a la diversidad dentro de una poblaciónCST(K) = el aporte de K a la diversidad entre poblacionesHT = la diversidad génica total HS = la diversidad génica dentro de una poblaciónDST = la diversidad entre poblacionesHT/K = la diversidad génica total, después de retirar la población KHS/K = la diversidad génica dentro de una población, después de retirar la población K DST/K = la diversidad génica entre poblaciones, después de retirar la población K

• La medida permite cuantificar la variación de la diversidad génica total cuando se introduce o se retira una población de un sitio (por ejemplo, al introducir una variedad nueva en el campo de un agricultor, como parte de un programa de conservación in situ).

• También sirve para medir el impacto ocasionado, en términos de diversidad génica, por la pérdida de una población en un lugar dado.

• Puede utilizarse únicamente con marcadores codominantes.

Page 109: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 22

La ecuación para la estructura genética de poblaciones es:

(1 - FIT) = (1 – FIS)(1 – FST)

FIT = 1 – (HI/HT)

FIS = 1 – (HI/HS)

FST = 1 – (HS/HT)

Estadísticos F (Wright)

Donde,HT = la diversidad génica total o la heterocigosidad esperada en la población total, estimada a partir de las frecuencias alélicas combinadasHI = la diversidad génica dentro de una población o la heterocigosidadpromedio observada en un grupo de poblaciones HS = la heterocigosidad promedio esperada, estimada a partir de cada subpoblación

Los estadísticos F permiten el análisis de estructura en poblaciones subdivididas. También puede emplearse para medir la distancia genética entre las subpoblaciones, un concepto que se fundamenta en la idea de que aquellas subpoblaciones que no presentan apareamiento entre sí tendrán frecuencias alélicas diferentes a las de la población total.

La distancia genética también provee una manera de medir la probabilidad de encuentro entre alelos iguales (endogamia). Los índices estadísticos involucrados miden:

FIS = la deficiencia o el exceso de heterocigotos promedio en cada poblaciónFST = el grado de diferenciación génica entre las poblaciones, en función de las frecuencias alélicasFIT = la deficiencia o el exceso de heterocigotos promedio en un grupo de poblaciones

Page 110: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 23

El rango de FST es:

10(fijación para alelos

alternos en diferentes subpoblaciones)

(no existe divergenciagenética)

Cuando FST es: entonces la diferenciación genética es:

de 0 a 0.05 pequeñade 0.05 a 0.15 moderadade 0.15 a 0.25 grande>0.25 muy grande

Interpretación de valores FST

Page 111: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 24

(0.495 + 0.420)/2 = 0.4575

Frecuencia genotípica

HS

(0.45 + 0.30)/2 = 0.375qo(0.3 + 0.2)/2 = 0.25HI

(0.55 + 0.70)/2 = 0.625po2(0.625)(0.375) = 0.4688HT

0.52380.42000.300.700.200.200.602

0.39390.49500.450.550.300.300.401

F2piqiqipiA2 A2A1 A2A1 A1

Pob.

FIT = 1 – (0.25/0.4688) = 0.4667

FIS = 1 – (0.25/0.4575) = 0.4536

FST = 1 – (0.4575/0.4688) = 0.0241

Cálculo de los estadísticos F

(continúa en la siguiente)

Esta diapositiva presenta un ejemplo de dos poblaciones y el análisis de un locus (A). Se calculan las frecuencias alélicas (p y q), al igual que sus promedios. También se calculan las variables HT, HI y HS, y se utilizan para calcular los estadísticos F. El análisis muestra una diferenciación baja en las frecuencias alélicas entre las dos poblaciones (FST). Podemos concluir que casi todo el déficit de heterocigotos se debió al apareamiento no aleatorio dentro de las poblaciones (FIS = 0.4536).

F = índice de fijación (primera columna a la derecha del cuadro), que es la probabilidad de que los dos alelos de un individuo sean los mismos. Su cálculo debe hacerse sólo con marcadores codominantes. Si se hace con marcadores dominantes, el cálculo puede resultar sesgado.

Page 112: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 25

qo

Frecuencia genotípica

(0.500 + 0.255)/2 = 0.3775HS

(0.50 + 0.15)/2 = 0.325(0.5 + 0.1)/2 = 0.30HI

(0.50 + 0.85)/2 = 0.675po2(0.675)(0.325) = 0.4388HT

0.60780.2550.150.850.100.100.802

0.00000.5000.500.500.250.500.251

F2piqiqipiA2 A2A1 A2A1 A1

Pob.

FIT = 1 – (0.30/0.4388) = 0.3163

FIS = 1 – (0.30/0.3775) = 0.2053

FST = 1 – (0.3775/0.4388) = 0.1397

Cálculo de los estadísticos F (continuación)

Este es otro ejemplo para el cual se siguieron los mismos procedimientos que en la diapositiva anterior. La diferenciación en las frecuencias alélicas entre las dos poblaciones parece mayor (FST = 0.1397), con solo un efecto moderado del apareamiento no aleatorio dentro de las poblaciones (FIS = 0.2053).

Page 113: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 26

f AMOVA es un método que sirve para estudiar la variación molecular dentro de una especie

f Se basa en un modelo jerárquico o anidadof Se diferencia de un análisis de varianza

(ANOVA) en que:• Puede contener diferentes suposiciones evolutivas

sin modificar la estructura básica del análisis• La hipótesis utiliza métodos de permutación que no

requieren la suposición de una distribución normal

Análisis de varianza molecular (AMOVA)

Los diferentes niveles jerárquicos de la diversidad génica, estudiados por medio del método AMOVA, pueden abarcar:

1. Continentes, que pueden contener niveles jerárquicos menores

2. Regiones geográficas dentro de un continente

3. Zonas dentro de una región, en un continente

4. Poblaciones dentro de una zona de una región, en un continente

5. Individuos dentro de una población en una zona de una región, en un continente

En los Apéndices 2 y 3 está la descripción matemática del modelo para las situaciones 3 y 4, respectivamente. Para consultarlos, haga clic aquí.

En las dos diapositivas que aparecen a continuación, se explica el modo de analizar la situación 4.

Page 114: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 27

011011150101111410111113011100121110011110011110011101900110081111117001000610100051101014101100311101121110001

A2A1A2A1A2A1

Pob. 3Pob. 2Pob. 1Ind.

AusenteA1 = 0PresenteA1 = 1

2916X...254182115���Xijk

2

88283327��Xi...k2

990324441225X...k2

54182115X...k

0.22222222CMw10SCw

0.26190476CMb11SCb

0.3CMa0.6Sca

Un ejemplo de AMOVA

(continúa en la siguiente)

En este cuadro, aparecen los datos obtenidos con 15 individuos de cada una de las tres poblaciones, en un análisis realizado con un marcador codominante. Mediante un análisis de varianza, estos datos nos permitirán calcular los estadísticos F.

El primer paso es convertir en variables binarias las bandas detectadas en los geles, asignándoles un valor de 0 ó de 1. Luego, se calculan las sumas de las presencias (1) paraque podamos proceder con la suma de cuadrados. Se realizan primero los cálculos para una población y se continúa con las demás hasta completar (X...k). Tenemos i = 15 individuos (efecto b), j = 2 alelos (efecto w), k = 3 poblaciones (efecto a).

Donde,X...k es el resultado de la suma de todas las bandas presentes en los individuos por poblaciónX...k2 es el resultado de elevar al cuadrado el número obtenido anteriormente¦ ¦ Xi...k2 es el resultado de sumar los cuadrados de la suma de alelospresentes en cada individuo (por ejemplo, Indiv.1 en la Pob.1 será (0 + 0)2 + Indiv.2 en la Pob.1 (1 + 1)2 + Indiv. ...)¦ ¦ ¦ Xijk

2 es la suma de cada valor al cuadradoSC es la suma de los cuadrados para los efectos a, b y wUn ejemplo para calcular SC: SCa = ¦ X...k2/ij – X...2/ijk = [990/(15 x 2)] - [2916/(15 x 2 x 3)] = 0.6CM son los cuadrados medios para los efectos a, b y wUn ejemplo para calcular CM: SCa/gla = 0.6/2 = 0.3, donde gla se refiere a los grados de libertad para el efecto a (poblaciones).

Page 115: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 28

ıw20.222222221045Dentro de indiv.

ıw2 + 2ıb

20.261904761142Indiv./poblaciónıw

2 + 2ıb2 + 2*15ıa

20.30.62PoblacionesCMECMSCglFV

0.91324(1 - FIS)(1 - FST)0.91324(1 - FIT) 0.0052185FST

0.0819672FIS

0.086758FIT

0.24333ı2

0.2222222ıw2

0.0198413ıb2

0.0012698ıa2

Cálculos de varianzas y estadísticos F

Un ejemplo de AMOVA (continuación)

Donde,FV = fuentes de variacióngl = grados de libertadSC = la suma de los cuadrados (ver diapositiva anterior)CM = cuadrados medios (ver diapositiva anterior)ı2 = varianza total calculadaCME = cuadrados medios esperados ıw

2 = 0.2222222ıb

2 = (CMb – CMw)/2 = (0.26190476 – 0.22222222)/2 = 0.0198413ıa

2 = (CMa – CMb)/2 15 = (0.3 – 0.26190476)/2 15 = 0.0012698ı2 = ıw

2 + ıb2 + ıa

2 = 0.24333 (varianza total calculada)

En la diapositiva 22, ya se ha explicado la forma de calcular los estadísticos F. Para este ejemplo en particular, sería de la siguiente manera:

FIT = (ıa2 + ıb

2)/ı2 = (0.0012698 + 0.0198413)/0.24333 = 0.086758FST = ıa

2/ı2 = 0.0012698/0.24333 = 0.0052185FIS = ıb

2/(ıb2 + ıw

2) = 0.0198413/(0.0198413 + 0.222222) = 0.0819672

La diferenciación de las frecuencias alélicas entre las tres poblaciones es muy baja (FST = 0.0052185) y probablemente es un resultado de muchos apareamientos al azar. Para sacar una conclusión, es necesario analizar un mayor número de loci.

Page 116: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 29

f Usando datos de secuencia• Diversidad de nucleótidos dentro de una población• Diversidad de nucleótidos entre poblaciones

f Usando datos de restricción• Variaciones en los patrones de bandas• Diversidad de nucleótidos dentro de una población• Diversidad de nucleótidos entre poblaciones

Cuantificación de las relaciones genéticas: Diversidad y diferenciación a nivel de nucleótido

Para realizar estos cálculos, se parte del supuesto de que cada nucleótido es un locus.

Page 117: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 30

Mide la diversidad de nucleótidos entre varias secuencias en una región dada del genoma, dentro de una población (ʌX)

ʌX = n/(n – 1)ȈXiXjʌij

Utilización de datos de secuencia: Diversidad de nucleótidos dentro de una población

Donde,n = el número de secuencias analizadas en los individuos de la poblaciónXi = la frecuencia estimada de la i-ésima secuencia en la poblaciónXj = la frecuencia calculada de la j-ésima secuencia en la población ʌij = la proporción de nucleótidos diferentes entre las secuencias i y j

• La medida brinda información acerca del grado de diversidad de nucleótidos entre varias secuencias, en una región dada del genoma. Equivale a la medida de la diversidad alélica dentro de un locus.

• Varía de 0 a 1 (0 � ʌX � 1).

• Entre los factores que limitan el uso de esta herramienta de análisis están los siguientes:

Debe haber disponibilidad de secuencias genómicas parcialesLa ecuación sólo puede aplicarse a datos haploides

Este parámetro da información acerca de las secuencias de nucleótidos, y el modelo supone la presencia de haplotipos (genotipos haploides). Aunque el estudio se basa en individuos diploides, es necesario secuenciar cada copia del genoma.

Page 118: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 31

10

2

1

2

5

n

2/10 = 0.2TCC G CGAT T ATTC T CAGGGTGC G GATG A ATSec4

1/10 = 0.1TCC A CGAT C ATTC C CAGGGTGC A GATG G ATSec3

2/10 = 0.2TCC A CGAT T ATTC G CAGGGTGC C GATG A ATSec2

5/10 = 0.5TCC T CGAT T ATTC C CAGGGTGC C GATG A ATSec1

Frec. XiSecuencia

Ȇ1,2 = 2/30, Ȇ1,3 = 4/30, Ȇ1,4 = 3/30, Ȇ2,3 = 4/30, Ȇ2,4 = 3/30, Ȇ3,4 = 5/30

ʌX = 10/(10 – 1)ȈXiXjʌij

= (10/9)[0.5 0.2 (2/30) + 0.5 0.1 (4/30) + ... + 1 0.2 (5/30)]

= 0.037

Cálculo de la diversidad de nucleótidos dentro de una población

Este ejemplo presenta 10 individuos en una población X. Para cada individuo, analizamos una secuencia de 30 nucleótidos y observamos que las secuencias individuales difieren en 5 nucleótidos (azul). En total, en la población hay cuatro secuencias alternas para estos 30 nucleótidos. La primera columna muestra el número de individuos (n) que tienen cada una de las alternativas de secuencia.

Calculamos el número de diferencias de nucleótidos en cada par de secuencias dentro de la población. Por ejemplo, Ȇ1,2 = 2/30 significa que entre las secuencias 1 y 2 hay dos diferencias entre los nucleótidos (T versus A en la posición 4, y C versus G en la posición 14).

Luego, calculamos ʌX para toda la población. El número obtenido es 0.037, o sea una diversidad de nucleótidos del 3.7%, con base en la secuencia analizada en la muestra de 10 individuos.

Page 119: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 32

f VXY mide la divergencia poblacional con base en el grado de variación de la secuencia (1 secuencia, 2 poblaciones)

VXY = dXY – (ʌX + ʌY)/2

f VW mide la diversidad promedio en una población con base en diversas secuencias

VW = (1/s)ȈʌX

f Vb mide la diferenciación total en diversas poblacionesVb = [1/(s(s – 1))]ȈXȈYVXY

f NST es la diferenciación relativa

NST = Vb/(Vb + VW)

Utilización de datos de secuencia: Diversidad de nucleótidos entre poblaciones

Donde,VXY = la divergencia entre las poblaciones X y YʌX = la diversidad de nucleótidos en la población XdXY = la probabilidad de que dos nucleótidos al azar, en las poblaciones X y Y, sean diferentes s = el número de poblaciones

• La medida brinda información acerca del nivel de diferenciación entre secuencias de nucleótidos en las poblaciones.

• Requiere datos de secuencia en una muestra de individuos para cada población.

• Necesita programas informáticos específicos con atributos que permitan la alineación de secuencias, por ejemplo CLUSTAL W, MALIGN y PAUP*.

Page 120: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 33

Diferenciación relativaNST = Vb/(Vb + VW) = 0.03825/(0.03825 + 0.0635) = 0.3759

Diversidad promedio en cada poblaciónVW = (1/s)ȈʌX = ½(0.037 + 0.09) = 0.0635

Diferenciación totalVb = [1/(s(s – 1))]ȈXȈYVXY = [1/(2(2 – 1))]0.0765 = 0.03825

Divergencia de nucleótidos entre X y YVXY = dXY – (ʌXʌY)/2 = 0.14 – (0.037 + 0.09)/2 = 0.0765

Cálculo de la diversidad de nucleótidos entre poblaciones

Digamos que tenemos otra población Y en la cual la diversidad de nucleótidos para la misma secuencia analizada en la diapositiva 31 es ʌY = 0.09.

También sabemos que la probabilidad de que dos nucleótidos tomados al azar sean diferentes en X y Y es de 0.14 (dXY).

En esta diapositiva, presentamos la divergencia entre las poblaciones X y Y (VXY), la diferenciación total (Vb), la diversidad promedio en cada población (Vw) y la diferenciación relativa (NST)..

Page 121: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 34

…GACTGAATTCCACGGCACTGACGAATTCGA…AGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC……CTGACTTAAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…

…GACTGATTTCCACGGCACTGACGAATTCGA…AGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC……CTGACTAAAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…

ADN Indiv. 1

ADN Indiv. 2

Sitio de restricción EcoRI

No existe sitio de reconocimiento

para EcoRI

Fragmento 1 Fragmento 2

Fragmento 2

M I1 I2

Gel

Fragmento 2

Fragmento 1

Utilización de datos de restricción: Variaciones en patrones de bandas

La ausencia del fragmento 1 en el Individuo2 indica que porta una secuencia diferente de ADN, al menos en este sitio de restricción. Basta una pequeña diferencia de apenas dos nucleótidos, en el dibujo, para hacer que desaparezca el sitio de reconocimiento para la enzima.

Page 122: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 35

Esta medición (ʌ) se basa en el número de fragmentos de restricción presentes en dos muestras

ʌ = - (1/r)ln G (si ʌ < 5%)

Utilización de datos de restricción: Diversidad de nucleótidos dentro de una población

Donde,r = el número de nucleótidos de reconocimiento de una enzima de restricciónln G = el logaritmo natural de la probabilidad de que no hubo substitución en el sitio de restricción. Se calcula del siguiente modo:

G = F(3 – 2Gº)1/4

F = [¦Xi(Xin – 1)]/[¦Xi(n – 1)]

F = la proporción de fragmentos compartidosGº = F1/4

n = el número de genotipos haploides en la población Xi = la frecuencia estimada del i-ésimo fragmento en la población

• La medida estima la diversidad en los sitios de restricción en una muestra, porque depende de la secuencia de nucleótidos de los sitios de reconocimiento de una enzima de restricción dada.

• Suministra información acerca de la substitución de nucleótidos en los sitios de restricción. Varía de 0 a 1 (0 d ʌX d 1).

• Las ecuaciones anteriores pueden utilizarse con muestras haploides, ADNmt, ADNcp o haplotipos.

Referencia

Karp, A., P. G. Isaac y D. S. Ingram. 1998. Molecular Tools for Screening Biodiversity: Plants and Animals. Chapman & Hall, Londres.

Page 123: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 36

f Esta medición (VXY) indica la divergencia o diferenciación entre poblaciones, con base en los datos de restricción

VXY = dXY – (ʌX + ʌY)/2

f También se utiliza esta medida con datos de marcadores RAPD

Utilización de datos de restricción: Diversidad de nucleótidos entre poblaciones

Donde,VXY = la divergencia o diferenciación entre las poblaciones X y YʌX = la diversidad de la restricción en la población XdXY = la diversidad de fragmentos entre dos poblaciones = – (2/r)ln (GXY)GXY = FXY(3 – 2GºXY)1/4

Gº = FXY1/4

FXY = la proporción de alelos compartidos entre las poblaciones X y Y = (2ȈXiXXiY)/(Ȉ(XiX + XiY))

XiX = la frecuencia calculada del fragmento i en la población X

• Calcula la diversidad en los sitios de restricción de una muestra de dos poblaciones o más. Brinda información acerca de la substitución de nucleótidos en los sitios de restricción.

• Resultan prácticos los programas informáticos como BIOSYS y GENEPOP. Los datos obtenidos son considerados como pertenecientes a organismos haploides.

Si se utiliza con datos de RAPD, el valor de ‘r’ es reemplazado por la longitud del cebador (r = 10).

Se hacen, además, ciertas suposiciones:

Que se emplean los cebadores apropiadosQue el polimorfismo originado por inserción o deleción es poco comúnQue los fragmentos de tamaño similar en poblaciones diferentes pertenecen al mismo locusQue se deben identificar los fragmentos sin error

Los programas que más se usan son RAPDISTANCE y RAPDIS.

Page 124: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 37

Cálculo de la diversidad de nucleótidos entre poblaciones

Población

XSX = -(1/6) ln (0.039358) = 0.539176

G = 0.0325[3 – 2(0.424591)]1/4 = 0.039358G° = (0.0325)1/4 = 0.424591

F = [0.30(0.30 3 – 1) + 0.25(0.25 3 – 1) + 0.45(0.45 3 – 1)] = 0.03250.30(3 – 1) + 0.25(3 – 1) + 0.45(3 – 1)

9/20 = 0.45A3

5/20 = 0.25A2

6/20 = 0.30A1

Frec. Xi2019181716151413121110987654321Sec.

Población

YSY = -(1/6) ln (0.272587) = 0.216633

G = 0.2425[ 3 – 2(0.701743)]1/4 = 0.272587G° = (0.2425)1/4 = 0.701743

F = [0.25(0.25 3 – 1) + 0.65(0.65 3 – 1) + 0.10(0.10 3 – 1)] = 0.24250.25(3 – 1) + 0.65(3 – 1) + 0.10(3 – 1)

2/20 = 0.10A3

13/20 = 0.65A2

5/20 = 0.25A1

Frec. Xi2019181716151413121110987654321Sec.

En cada población, detectamos tres fragmentos de ADN, como resultado de una restricción: A1, A2 y A3.

La diversidad de nucleótidos en las regiones analizadas es más grande en la población X (ʌX= 0.5392) que en la población Y (ʌY = 0.2166); por tanto, X tiene mayor diversidad génica que Y.

Entre las poblaciones X y Y, la diferenciación de nucleótidos con base en los sitios de restricción es de 0.230766.

� � 0.6130521/4

0.14125XYG q

> @� � � � � � 0.141250.100.450.650.250.250.30

0.10*0.450.65*0.250.25*0.302F �������

� �> @ 163012.04/1613052.023 14125.0GXY �

� � � � 604643.0163012.0ln6/2dXY �

� � 226739.0216633.0539176.021604643.0VXY ��

� � 377905.0216633.0539176.021VW �

� � 11337.0226739.021Vb

0.2307660.3779050.11337

0.11337NST

Page 125: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 38

f La distancia genética entre dos muestras se describe como la proporción de elementos genéticos (alelos, genes, gametos, genotipos) que no son compartidos por ambas muestras

f D = 1 cuando, y solamente cuando, las dos muestras no tienen elementos genéticos en común

Cuantificación de las relaciones genéticas: Distancia genética

Según las similitudes de los individuos, son posibles tres tipos de representación de la distancia (D):

• D = 1 – S, conocida como la distancia lineal porque asume que la relación con la similitud es lineal.

• D = �(1 – S), conocida como la distancia cuadrática porque asume que la relación con la similitud se ajusta a una función cuadrática, de manera que para volverla lineal es necesario calcular la raíz cuadrada.

• D = �(1 – S2), conocida como la distancia circular.

Linear

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

Similitud

Dis

tanc

ia

Quadratic

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

Similitud

Dis

tanc

ia

R

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

Similitud

Dist

anci

a

Lineal Cuadrática

Circular

Page 126: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 39

El cálculo de la distancia o disimilitud se ajusta a uno de estos dos modelos posibles:

Modelo de equilibrio

La distancia permanece constante con el tiempo (existe equilibrio entre

la migración y la deriva genética)

d

d

t

t + 1

La distancia cambia con el tiempo, a través de

la migración y la deriva genética

t + 1

d2

d1

t

Modelo de desequilibrio

Modelos de distancia

Para nuestros propósitos, emplearemos el modelo de desequilibrio. Existen dos alternativas:

• Distancia geométrica� No considera los procesos evolutivos� Se basa solamente en las frecuencias alélicas� Existe una relación compleja entre la distancia y el tiempo de divergencia

• Distancia genética� No considera los procesos evolutivos � La distancia aumenta a partir del momento de separación de una población

ancestral� Requiere un modelo genético de evolución

¿Cuándo debemos emplear la distancia geométrica y cuándo la distancia genética?• La distancia geométrica se emplea para estudios de diversidad en los cuales se

hacen comparaciones según los datos morfológicos o de marcadores recopilados de las unidades taxonómicas operativas (UTO). Las UTO pueden ser individuos, accesiones o poblaciones. La distancia geométrica puede utilizarse con marcadores dominantes (RAPD, AFLP) o codominantes. Dado que no se consideran los aspectos evolutivos, los dendrogramas obtenidos no pueden interpretarse como árboles filogenéticos que suministran información acerca de la evolución o divergencia entre grupos.

• Por el contrario, la distancia genética de cualquier UTO dada puede incorporarse en estudios filogenéticos. El modelo contempla las frecuencias alélicas en las UTO y su fundamento matemático es diferente. Puede utilizarse con marcadores codominantes y dominantes; no obstante, con éstos últimos, se pierde información porque solamente se pueden calificar dos alelos. La distancia genética con marcadores dominantes requiere que se examinen dos generaciones de la misma población para medir la segregación de los loci (Lynch y Milligan, 1994).

ReferenciaLynch, M. y B. G. Milligan. 1994. Analysis of population genetic structure with RAPD

markers. Mol. Ecol. 3:91-99.

Page 127: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 40

f Mide la relación directa entre el índice de similitud (s) y la distancia (D = 1 – s)

f Son posibles diferentes situaciones; por ejemplo:

• Variables binarias• Variables cuantitativas• Tipos mixtos de variables• Número P de variables

Modelos de desequilibrio: Distancia geométrica

(continúa en la siguiente)

Al analizar datos moleculares, tratamos con variables binarias (1,0). Estas se discutirán en las diapositivas que aparecen a continuación.

En el Apéndice 4, hay información adicional sobre aquellos casos en los cuales es necesario utilizar también variables cuantitativas, tipos mixtos de variables y un número diverso de variables. En el Apéndice 5, se ha agregado un ejemplo sobre cómo calcular las distancias geométricas con variables cuantitativas. Para consultar los Apéndices 4 y 5, haga clic aquí.

Page 128: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 41

Con variables binarias: • Se emplea el análisis multivariado y se elaboran

matrices de similitud o diferenciación entre los posibles pares de individuos o unidades taxonómicas operativas (UTO)

• Dos individuos similares tienen, simultáneamente, el valor mínimo de distancia y el valor máximo de similitud

• La distancia y la similitud están inversamente relacionadas

• La similitud se calcula por el número de coincidencias

Distancia geométrica (continuación)

Al emplear datos de marcadores moleculares y transformarlos en datos binarios, hay que tener en cuenta los siguientes aspectos:

• El número de ploidía de una especie puede ocultar la presencia de series alélicas en un locus. Si esto sucede, se subestimará la diversidad genética al emplear marcadores dominantes (presencia/ausencia).

• Si un marcador es codominante, se necesitan muestras de gran tamaño para que se puedan detectar todos los genotipos posibles, especialmente si hay varios alelos por locus.

• Son comunes las distorsiones de segregación en las especies poliploides.

• La mayoría de los programas de informática especializados están diseñados para analizar especies diploides. Por lo tanto, si se usan con especies poliploides, puede haber sesgos en la estimación de los diversos índices de diversidad genética.

• El sistema reproductivo de ciertas especies no ha sido estudiado, de manera que no se conoce lo suficiente acerca de su tipo de herencia.

• Para obtener estimaciones confiables de diversidad genética, se debe muestrear y analizar la mayor cobertura posible (regiones de codificación y de no codificación) del genoma de la especie en estudio.

Page 129: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 42

Cálculo de frecuencias alélicas para diploidesy tetraploides: Marcador dominante

Locus A diploide

(2X) Locus A

tetraploide(4X)

IndividuosM 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1

1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1

Matriz binaria

Frec. alélicaGenotiposLocus

0.69

q

0.47

q

0.31

p

0.53

p

TotalaaaaAAAA, AAAa, AAaa, AaaaTetraploide

A(4X)

1q4p4 + 4p3q + 6p2q2 + 4pq3Frec. geno. (esp.)

18414No. de indiv.

1P2 = 0.22P1 = 0.78Frec. geno. (obs.)

1P2 = 0.22P1 = 0.78Frec. geno. (obs.)

14

p2 + 2pq

AA, Aa

184No. de indiv.

1q2Frec. geno. (esp.)

TotalaaDiploide

A(2X)

En ambos casos, las frecuencias alélicas deben ser diferentes. No obstante, la pérdida de información en el individuo tetraploide es significativa. ¿A qué se debe esto? A que para calcular la frecuencia del alelo recesivo a, no se consideran los heterocigotos AAAa, Aaaa y Aaaa. Este efecto es mucho mayor cuando no se conoce el número de ploidía de la especie en estudio (esp. = valor esperado; obs. = valor observado).

En este ejemplo, 18 individuos de una especie diploide y 18 de una especie tetraploide fueron analizados con un marcador dominante. Los patrones de bandas obtenidos son similares. En ambos casos, las bandas se convierten en un cuadro binario. Los cálculos de frecuencias están abajo. Observamos que, por ejemplo, en el tetraploide, el genotipo 1 puede ser AAAA, AAAa, AAaa o Aaaa; pero la banda se leerá como presente (1) al igual que en el diploide (AA o Aa).

Page 130: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 43

Matriz binaria diploide

I N D I V I D U O S

(1,0,0) (1,0,1) (0,0,1) (1,0,1) (0,1,1) (1,0,0) (1,0,1) (0,0,1) (0,0,1) (0,1,0) (1,1,0) (0,0,1) (0,0,1) (0,0,1) (0,0,1) (0,1,1) (1,0,1) (0,0,1)

M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

Cálculo de frecuencias alélicas para diploidesy tetraploides: Marcador codominante

Locus A diploide

(2X)

Locus Atetraploide

(4X)

Individuos

A 1A 1

A 1A 1

A 1A 1

A 2 A

3

A 1A 2

A2

A 3

A 1A 2

A3

A 3

A 3A 3

A 3A 3

M 1 2 3 4 5 6 7 8 9 1810 11 12 1716151413

A1

A1

A1

A2

A1

A3

A 2 A

2

A2

A3

A3

A3

En este ejemplo, hay 18 individuos de una especie diploide y 18 de una especie tetraploide analizados utilizando un marcador codominante. En ambas situaciones, se detecta un locus (A) con tres alelos (A1, A2 y A3).

El cálculo de las frecuencias alélicas en los individuos diploides no es difícil (matriz binaria, parte inferior de la diapositiva). Sin embargo, con individuos tetraploides, se dificulta la conversión a datos binarios debido a que aquellos que portan los alelos A1 A1 A2 A3 no pueden diferenciarse de los que tienen otras combinaciones como A1 A2 A2 A3 o A1 A2 A3 A3. Esta situación solamente puede ser resuelta por inferencia, con base en el cálculo del número de copias del fragmento de ADN en el gel.

0.25

p

0.15

q

1

18

1

Total

P13 = 0.22

4

2pr

A1A3

P22 = 0.06

1

q2

A2A2

P23 = 0.11

2

2qr

A2A3

0.60

r

P33 = 0.44

P12 = 0.06

P11 = 0.11

Frec. geno. (obs.)

2

p2

A1 A1

81Indiv. (no.)

r22pqFrec. geno. (esp.)

A3A3

A1A2

Genotipo

(esp. = valor esperado; obs. = valor observado).

Page 131: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 44

1.250(a + d)/(b + c)Sokal y Sneath 3 (1963)S130.714(a + d)/[a + d + (b + c)/2]Sokal y Sneath 1 (1963)S120.385(a + d)/[a + d + 2(b + c)]Rogers y Tanimoto (1960)S110.556(a + d)/nSokal y Michener (1958)S100.750a/(b + c)Kulczynski 1 (1928)S90.273a/[a +2(b + c)]Sokal y Sneath 5 (1963)S80.429a/(a + b + c)Jaccard (1900, 1901, 1908)S70.625(a/2)([1/(a+b)] + [1/(a+c)])Kulczynski 2S60.612a/[(a + b)(a + c)]1/2Ochiai (1957)S50.600a/[a + (b + c)/2]Dice (1945); Nei y Li (1979)S40.500a/max[(a + b),(a + c)]Braun-BlanquetS30.750a/min[(a + b),(a + c)]SimpsonS20.333a/nRussel y Rao (1940)S1

Ejemplo del valor del coeficiente si

a = 3, b = 1, c = 3, d = 2ExpresiónAutor

Coeficientes de similitud para variables binarias: Ejemplos

Donde, n = a + b + c + d

En el cuadro de la diapositiva, observamos que:

Los índices S1 a S9 dan valor solamente a la presencia de informaciónLos índices S10 a S13 dan valor tanto a la presencia de información como a su ausencia

A continuación, discutiremos tres índices (los que aparecen en rojo en la diapositiva): Concordancia Simple (S10), Jaccard (S7) y Nei-Li (S4).

c + ddc0

a + bba1

Indiv.i

b + d

0

a + c

1

Indiv.j

n

Page 132: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 45

Coeficiente de concordancia simple:(a + d)/(a + b + c + d)

Coeficiente de Jaccard:a/(a + b + c)

Coeficiente de Nei-Li, o de Dice:2a/(2a + b + c)

Índices de distancia geométrica

Estos tres índices difieren en su enfoque para estimar el número de coincidencias y diferencias.

El Coeficiente de Concordancia Simple considera que la ausencia corresponde a loci homocigóticos. Puede usarse con datos de marcadores dominantes (RAPD y AFLP), por cuanto las ausencias podrían corresponder a recesivos homocigóticos. En el Apéndice 6 se da un ejemplo de aplicación del Coeficiente de Concordancia Simple para variables categóricas (haga clic aquí).

El Coeficiente de Jaccard solamente cuenta las bandas presentes para cualquiera de los individuos (‘i’ o ‘j’). Las ausencias dobles se consideran como datos ausentes. Si se presentan falsos positivos o falsos negativos, la estimación del índice tiende a ser sesgada. Puede aplicarse con datos de marcadores codominantes.

El Coeficiente de Nei-Li cuenta el porcentaje de bandas compartidas entre dos individuos y le da más importancia a aquellas bandas presentes en ambos. Considera que la ausencia tiene menor importancia biológica y, de esta manera, este coeficiente tiene un significado completo en función de la similitud del ADN. Puede aplicarse con datos de marcadores codominantes (RFLP, SSR).

Page 133: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 46

f Mide la diferencia entre dos genes, proporcional al tiempo de separación de un ancestro común

f Varios modelos son posibles:• Mutación de alelos infinitos

p. ej. Distancia genética de Nei

• Modelo de mutación gradualp. ej. Distancia con microsatélites

• Mutación en la secuencia de nucleótidos

Modelos de desequilibrio: Distancia genética

• Mutación de alelos infinitos (isoenzimas)– Cada mutación da origen a un alelo nuevo. – Si 2 genes son iguales, no ha habido mutación. Si 2 genes son

diferentes, se presentó un número desconocido de mutaciones.– El número promedio de mutaciones desde el momento t, cuando

divergieron de un ascestro es = 2tµ, donde µ es la tasa de mutación y se multiplica por 2 porque estamos tratando con 2 genes independientes.

– La probabilidad de que 2 genes provengan de un mismo progenitor después del momento t es de P= e-2tµ.

• Modelo de mutación gradual (SSR)– La mutación es un cambio progresivo de tal manera que los fragmentos

que migran distancias similares han experimentado pocas mutaciones.– En el caso de las SSR, se asume que la mutación modifica el número

de repeticiones, aumentando o disminuyendo paso a paso. Puede mostrarse que el cuadrado de la diferencia en el número de repeticiones entre 2 microsatélites es proporcional al momento de divergencia de un ancestro común.

• Mutación en la secuencia de nucleótidos – Indica que la substitucion más sencilla es la mutación de una base

única.– La limitación principal es la pérdida de informacion por desconocer el

número de mutaciones que podrían haber ocurrido en un sitio. Para resolver ese problema, algunos métodos asumen la probabilidad de transición (purina o purina o pirimidina o pirimidina) y de transversión(purina o pirimidina o pirimidina o purina).

Page 134: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 47

f La distancia genética estándar de Nei es:

f Se basa en el concepto de identidad genética (IXY):

)J(JJI

yx

xyxy

)(I ln D XYXY �

Cálculo de la distancia genética de Nei

(continúa en la siguiente)Donde,

JX = la homocigosidad promedio en la población XJY = la homocigosidad promedio en la población YJXY = la homocigosidad promedio entre poblaciones

De manera que,IXY = 1, si dos poblaciones tienen las mismas frecuencias alélicas en todos los loci muestreadosIXY = 0, si dos poblaciones no comparten las mismas frecuencias alélicasen todos los loci muestreados

• El valor de DXY varía de 0 (donde las poblaciones tienen frecuencias alélicasidénticas) a infinito (f, donde las poblaciones no comparten ningún alelo).

• Asume que la tasa de substitución por locus es igual entre todos los loci y las poblaciones.

• Esta distancia calcula las diferencias de codones por locus entre dos poblaciones.

Page 135: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 48

D2,3 = 0.0440D1,3 = 0.0107D1,2 = 0.0852Dii’Distancia genéticaI2,3 = 0.9570I1,3 = 0.9894I1,2 = 0.9183Iii’Identidad genéticaJ2,3 = 0.8986J1,3 = 0.9346J1,2 = 0.8733Jii’Homocig. prom. entre poblac.0.93270.94530.9567JiHomocigosidad promedio0.06730.05470.0433HiHeterocigosidad promedio0.42000.000.0000hijkHeterocigosidad del locus0.700.001.00D2

0.301.000.00D1D0.00000.32580.2434hijkHeterocigosidad del locus0.000.090.13B3

0.000.100.01B2

1.000.810.86B1B0.45500.38480.3200hijkHeterocigosidad del locus0.350.260.20A2

0.650.740.80A1APoblación 3Población 2Población 1

Frecuencias alélicasAlelosLocus

Cálculo de la distancia genética de Nei(continuación)

En este ejemplo hay i = 3 poblaciones, j = 3 loci polimórficos y 10 locimonomórficos. Además, hay diferentes números (K) de alelos por locus (por ejemplo, A y D tienen 2 alelos cada uno y B, 3 alelos).

En el cuadro aparecen los resultados del cálculo de las frecuencias alélicasen cada población, así como la heterocigosidad por locus. A continuación, calculamos la heterocigosidad y la homocigosidad promedio (1 - heterocigosidad) por población.

Luego, calculamos la homocigosidad entre poblaciones y la identidad genética para estimar la distancia genética de Nei:

jii’jk = 6ii’j pijk pi’jk, por ejemplo, j1,2jk = la homocigosidad entre las poblaciones 1 y 2

j1,2jk = (0.8)(0.74) + (0.2)(0.26) + (0.86)(0.81) + (0.01)(0.10) + (0.13)(0.09) + (0.0)(1.0) + (1.0)(0.0) + 10 = 11.3533

J1,2 = la homocigosidad promedio entre poblaciones = j1,2jk/13 = 11.3533/13 = 0.8733

I1,2 = la identidad genética entre las poblaciones 1 y 2 = J1,2/�(J1J2) = 0.8733/�(0.9567 0.9453) = 0.9183D1,2 = la distancia genética entre las poblaciones 1 y 2 = -ln(I1,2) = -ln(0.9183) = 0.0852

Puesto que aún no hemos explicado los métodos de agrupación, en el Apéndice 7 presentamos la matriz de distancia y el dendrograma de este ejemplo (haga clic aquí).

Page 136: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 49

¦� ��

i'i2

i'i'iiwi )a(a1)2n(2n

2S

¦ j wjsw S)(1/dS

Cálculo de la distancia dentro de una población, usando microsatélites

f La distancia dentro de una población es el promedio de la suma de los cuadrados de las diferencias en número de repeticiones entre alelos

f La distancia promedio dentro de una población puede calcularse para todos los loci analizados (ds)

Donde,aij = tamaño del alelo de la i-ésima copia (i = 1, 2, …, 2n) en la j-ésimapoblación (j = 1, 2, …, ds)n = número de individuos en la muestra

Existen dos aspectos que se deben tener en cuenta:

El cálculo de la distancia entre dos alelos es una transformación del número de repeticiones. Una de las dificultades en el uso de las SSR para estimar distancias genéticas es que su tasa de mutación es alta.

Page 137: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 50

Este es el componente entre poblaciones para la distancia promedio entre todas las comparaciones de pares de alelos

¦ ¦ ��

� �j'j i'i2

j'i'ijss

2B ) a (a1) (d d (2n)

2 S

Cálculo de la distancia entre poblaciones, usando microsatélites

La distancia global es el promedio ponderado entre el componente dentro de poblaciones y el componente entre poblaciones.

Estos coeficientes representan la probabilidad de elegir dos copias diferentes de un locus en la misma población y entre dos poblaciones.

Programas informáticos útiles: MICROSAT, BIOSYS, GENEPOP, GDA y POPGENE.

Bs

sw

sS

1)(2nd1)2n(dS

1)(2nd1-2nS

��

��

Page 138: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 51

Es el proceso de agrupar (o conglomerar) objetos en categorías o clases, con base en sus particularidades o relaciones comunes. La agrupación puede ser:

• Jerárquica:� Esencialista, la que trata de descubrir su verdadera

naturaleza o forma� Cladística, la que se basa en la genealogía o filogenia� Evolutiva, la que se basa en la filogenia y en la

cantidad de cambios evolutivos� Fenética, la que se basa en el mayor número de

caracteres de un organismo y su ciclo vital • No jerárquica• Superpuesta

Visualización de las relaciones: Clasificación o agrupación

• Jerárquica: una clase principal que contiene clases menores denominadas ‘ramas’.

• No jerárquica: cada individuo es asignado a un grupo único al compararlo con las clases iniciales, de suerte que su posicionamiento sea el más apropiado.

• Superposición: los individuos pueden pertenecer a más de un grupo.

Los tipos de clasificación se refieren a los procedimientos para catalogar objetos, organismos, etc., y se utilizan en varios campos del conocimiento. En nuestro caso, empleamos la clasificación jerárquica debido a la naturaleza de las relaciones entre individuos; es decir, el individuo, la población, la accesión, la variedad, etc., son unidades que no pueden ser asignadas simultánemente a dos grupos diferentes.

Referencia

García, J. A., M. C. Duque, J. Tohme, S. Xu y M. Levy. 1995. SAS for ClassificationAnalysis; Agrobiotecnology Course, October 1995. Documento de Trabajo. Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia.

Page 139: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 52

Clasificación fenética

f Muestra las relaciones entre las muestras mediante el uso de un índice de similitud

f Se selecciona un método de agrupación o distancia, de manera que se pueda trazar un diagrama de árbol (dendrograma) o un fenograma (si la matriz de similitud contiene datos fenotípicos)

1 2 3 3 2 4 1

1

2 3

4

En este ejemplo de agrupación jerárquica, a todos los caracteres se les da la misma importancia en el proceso de agrupación.

La similitud total entre dos grupos es la suma de la similitud para cada carácter.

No tiene en cuenta la genealogía.

Fenético se refiere a cualquier carácter empleado en el procedimiento de clasificación, ya sea morfológico, fisiológico, ecológico, molecular o citológico.

Page 140: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 53

Métodos de agrupación

f Pasos a seguir:• Se define la cercanía• Se estima cada agrupación, según la distancia• Se conforman las ramas del dendrograma en cada

ciclo

f Los tres métodos principales son:• Ligamiento simple (o ‘vecino más cercano’)• Ligamiento completo (o ‘vecino más lejano’)• Ligamiento promedio (o UPGMA)

Hay otros métodos de agrupación disponibles, como:

• El método de agrupamiento de pares no ponderados utilizando el centroide(UPGMC). Se basa en la distancia entre el valor medio para cada grupo.

• El método de agrupamiento de pares ponderados utilizando el centroide(WPGMC). Considera el valor medio de las UTO en los grupos.

• Método de Ward. Funciona con la suma de las distancias al cuadrado entre pares de UTO. También se conoce como el método de la varianza mínima porque, como considera los valores al cuadrado, se vuelve un método muy sensible (las UTO diferentes parecerán más disímiles y las UTO similares parecerán aún más cercanas). Puede utilizarse con distancias euclidianas y datos moleculares si se dispone de un número alto de bandas de ADN.

En las siguientes diapositivas, tratamos en más detalle los tres métodos que se mencionan en esta diapositiva y presentamos un ejemplo para cada uno de ellos.

Page 141: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 54

f O ‘vecino más cercano’f Minimiza la distancia entre grupos al tomar la

distancia al vecino con el que presenta mayor similitud

f Funciona con grupos uniformes y compactos, pero se afecta con los individuos distantes. Esto resulta inconveniente cuando hay grupos diferentes que no están bien distribuidos en el espacio

Grupo 1 Grupo 2

d(1,2)d(1,2) = distancia mínima entre dos UTO

Ligamiento simple

Page 142: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 55

Ligamiento simple: Un ejemplo

00.400.600.28D00.350.43C

00.30B0A

DCBA(1) (2)

(3)

00.400.30AD00.35C

0BADCB

0.100.200.300.400.50 0.0

A

D

B

C

(4)

00.35ADB0C

ADBC

1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, se selecciona la distancia más corta, dAD = 0.28.

2. Se elabora una nueva matriz al agrupar los individuos A y D y se calculan las distancias combinadas:

dB(AD) = min (dBA; dBD) = min (0.30; 0.60) = 0.30dC(AD) = min (dCA; dCD) = min (0.43; 0.40) = 0.40

3. Se elabora una nueva matriz al agrupar el individuo B con el grupo (AD) y se calculan las distancias combinadas:

dC(ADB) = min (dAC; dCD; dCB) = min (0.43; 0.40; 0.35) = 0.35

4. Se dibuja el dendrograma.

Page 143: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 56

f O ‘vecino más lejano’f Minimiza la distancia entre grupos al tomar la

distancia al individuo con el que presenta menor similitud

f Funciona bien con grupos uniformes y compactos pero, nuevamente, recibe influencia de los individuos distantes

Grupo 1 Grupo 2

d(1,2)d(1,2) = distancia mayor entre dos UTO

Ligamiento completo

Page 144: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 57

Ligamiento completo: Un ejemplo

00.400.600.28D00.350.43C

00.30B0A

DCBA(1) (2)

(3) (4)

00.400.30BD00.43C

0ABDCA

0.100.200.300.400.500.60 0.0

A

D

B

C

00.40DB0AC

DBAC

1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, se selecciona la distancia más larga, dBD = 0.60.

2. Se elabora una nueva matriz al agrupar los individuos B y D y se calculan las distancias combinadas:

dA(BD) = max(dBA; dAD) = max(0.30; 0.28) = 0.30dC(BD) = max(dCB; dCD) = max(0.35; 0.40) = 0.40

3. Se elabora la nueva matriz con los grupos AC y BD, y se calculan las distancias combinadas:

d(AC)(DB) = max (dAD; dAB; dCD; dCB) = max (0.28; 0.30; 0.40; 0.35) = 0.40

4. Se dibuja el dendrograma.

Page 145: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 58

f O ‘método de agrupamiento de pares no ponderados usando la media aritmética’(UPGMA)

f Minimiza la distancia entre grupos, al tomar la distancia promedio de todos los pares entre los individuos de la muestra

f Método más empleado

d(1i,2j) = distancia promedio entre UTOi y UTOj de los grupos 1 y 2

Grupo 1 Grupo 2

Ligamiento promedio

Page 146: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 59

Ligamiento promedio: Un ejemplo

00.400.600.28D00.350.43C

00.30B0A

DCBA(1) (2)

(3) (4) 0.10.20.30.40.5 0.0

B

DA

C

00.4150.45AD00.35C

0BADCB

00.42AD0BC

ADBC

1. Primero, se elabora la matriz de distancia; luego, en un primer ciclo, se selecciona la distancia más corta, dAD = 0.28.

2. A continuación, se elabora una matriz al agrupar el individuo A con el D y secalculan las distancias combinadas:

dB(AD) = (dBA + dBD)/2 = (0.30 + 0.60)/2 = 0.45dC(AD) = (dCA + dCD)/2 = (0.43 + 0.40)/2 = 0.415

3. Se elabora una nueva matriz al agrupar los individuos que tengan la distancia más corta, B con C, y se calculan las distancias combinadas:

d(AD) (BC) = (dAB + dAC + dBD + dBC)/4 = (0.30 + 0.43 + 0.60 + 0.35)/4 = 0.42

Page 147: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 60

f En primer lugar, se reúne información sobre la especie en estudio, por ejemplo su diversidad, su sistema de reproducción, su número de ploidía y sus niveles de heterocigosidad

f Se seleccionan con cuidado los caracteres genéticos que se van a analizar

f Luego se prueban diferentes metodologías de agrupación y se evalúa el nivel de concordancia obtenido con cada una de ellas

Selección de un método de agrupación

Además, siempre será importante combinar la mayor cantidad de información que sea posible. En el Apéndice 8 (haga clic aquí) puede encontrar un ejemplo en que se presentan datos morfológicos y moleculares, y se compara el uso de series de datos separados con el uso de datos combinados.

Page 148: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 61

f Validación externa

f Validación interna

f Validación relativa

f ‘Bootstrapping’ (Método de remuestreo)

Validación del análisis de conglomerados

Validación externa:Se compara la matriz de distancia con otra información que no se haya usado en los cálculos de agrupación (por ejemplo, la genealogía).

Validación interna:Esta técnica cuantifica la distorsión debida al método de agrupación empleado. Elabora una nueva matriz de similitud o distancia, la ‘matriz cofenética’, directamente a partir del dendrograma. Se calcula la validación mediante un coeficiente de correlación entre los datos de similitud o distancia a partir de la matriz original y los de la nueva matriz cofenética. Al finalizar el ejercicio de agrupación, se evalúa si se mantienen o no las distancias originales (Sokal y Rohlf, 1994).

Validación relativa:Se compara la similitud entre métodos.

Bootstrapping:Es un método de remuestreo con reemplazo, con la misma matriz de datos. Permite el cálculo de las desviaciones estándar y varianzas, y es útil para aquellas situaciones en las cuales el número de muestras o los recursos (por ejemplo, el tiempo, el presupuesto) son limitados.

A continuación, se presentan ejemplos de la aplicación de los métodos de correlación cofenética y bootstrapping.

Referencia

Sokal, R. y J. Rohlf. 1994. Biometry: The Principles and Practice of Statistics in Biological Research (3rd edn). Freeman & Co, NY.

Page 149: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 62

00.400.600.28D00.350.43C

00.30B0A

DCBA

Matriz de distancia original

Dendrograma

0.100.200.300.400.500.60 0.0

00.430.430.28D00.350.43C

00.43B0A

DCBA

Matriz cofenética

B

D

A

C

0.280.350.43

Correlación cofenética = 0.5557

Correlación cofenética: Un ejemplo

Para elaborar la matriz cofenética, observemos el dendrograma que se dibujóanteriormente con la matriz original (este ejemplo corresponde a la diapositiva 58). Vemos que la distancia entre D y C en el dendrograma es de 0.43; entonces, llenamos esta celda en la matriz cofenética. La distancia entre B y C es de 0.35, y así sucesivamente.

Los cálculos para la correlación cofenética se basan en el coeficiente de correlación:

r = (6XiYi - 6Xi6Yi/n)/SXiSYi

Donde,Xi y Yi son los valores de similitud o distancia de la matriz original y de la matriz cofenética, respectivamente.SXi y SYi son las desviaciones estándar para cada variable.

Si el valor de la correlación es alto, podemos concluir que el dendrograma sí refleja las distancias en la matriz original y, por tanto, no existe ninguna distorsión originada por el método de agrupación. En el ejemplo anterior, obtuvimos un valor de 0.5557. Este es un valor promedio que podría indicar que las distancias del dendrograma no reflejan los datos de distancia en la matriz original y existe, por consiguiente, distorsión a causa del método empleado. No obstante, al elaborar este ejemplo, utilizamos muy pocos datos y no eran los resultados reales de un experimento, lo que puede explicar el valor obtenido.

Page 150: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 63

1000L5

0011L4

1101L3

1010L2

1001L1

P4P3P2P1

Matriz de datos

Matriz de similitud

A P1 P2 P3 P4

Gel

BC

DE

(1) (2)

(3)

10.4000.2000.400P4

10.4000.600P3

10.400P2

1P1

P4P3P2P1

Validación mediante ‘bootstrapping’: Un ejemplo

(continúa en la siguiente)

En el gel que aparece en la esquina superior izquierda, hay 4 individuos (Pi) y5 loci (Lj). Vamos a suponer que realizamos la validación en tres muestras con reemplazo.

En primer lugar, registramos los datos de los marcadores en los individuos (matriz de datos) y, a continuación, calculamos la similitud promedio (concordancia simple) y su intervalo.

Page 151: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 64

10.400 ± 0.2000.200 ± 0.0000.533 ± 0.115P4

10.400 ± 0.2000.600 ± 0.000P3

10.267 ± 0.115P2

1P1

P4P3P2P1

Matriz de similitud promedio con desviaciones estándar

Dendrograma antes del reemplazo Dendrograma con reemplazo

Validación mediante ‘bootstrapping’: Un ejemplo (continuación)

1

0.25 0.44 0.63 0.81 1.00

3

2

4

0.11 0.33 0.56 0.78 1.00

1

3

4

2

Para cada individuo, se toma el valor para cada locus, uno por uno, con reemplazo y se elabora una muestra de igual tamaño al número de loci. Existe la posibilidad de que se seleccione un locus una o más veces. Para el ejemplo:

M1: L1 L1 L2 L3 L5 (no salió el locus L4 )M2: L1 L2 L3 L4 L3

M3: L3 L1 L5 L2 L4

En cada muestra, se calcula una matriz de similitud.

Se calculan las similitudes promedio y sus desviaciones estándar para cada par de individuos (1 y 2, 1 y 3, 2 y 3, y así sucesivamente), y se elabora la matriz de similitud promedio.

Se construye un nuevo dendrograma, empleando la matriz de similitud promedio.

Para situaciones reales, deben generarse más de 100 muestras de reemplazo.

Page 152: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 65

f La ordenación es la disposición o ‘arreglo’ de las unidades de muestra en sistemas de coordenadas

f La finalidad de la ordenación, al igual que los métodos de clasificación, es la de interpretar patrones en la composición de las muestras

Visualización de las relaciones: Ordenación

La ordenación es un método multivariado que complementa la agrupación y casi siempre se le considera como una estrategia que más se aproxima a la realidad biológica.

Lo que se quiere representar con los métodos de ordenación son las relaciones de las muestras de una manera sencilla, al reducir la situación real a un ‘espacio dimensional bajo’ (Gauch, 1982). Para hacerlo, se estudia la composición de la muestra como un todo, se mejora la comparación estadística del análisis porque, de alguna manera, se elimina o reduce la redundancia y se puede determinar la importancia relativa de diferentes gradientes. Sobre todo, se obtienen representaciones gráficas que nos ayudan a interpretar de manera intuitiva las relaciones de los diferentes grupos de muestras.

La ordenación, en principio, es una herramienta exploratoria para probar hipótesis. En cualquier caso, los resultados obtenidos con los métodos de ordenación deben contrastarse con los conocimientos disponibles de la muestra en estudio y, en la medida de lo posible, con información adicional relacionada con la pregunta biológica objeto de la investigación.

Referencia

Gauch, H. G., Jr. 1982. Multivariate Analysis and Community Structure. Cambridge University Press, Reino Unido.

Page 153: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 66

f Análisis de coordenadas principales (PCoA)

f Escalamiento multidimensional no métrico (NMDS)

f Análisis de correspondencia (CA)

Métodos útiles de ordenación para los datos de marcadores moleculares

Existen varias técnicas de ordenación —algunas se basan en datos de distancia o en cálculos de los denominados valores Eigen (la suma de todas las varianzas para cada carácter, en cada componente). Sin embargo, no es conveniente usar aquellas técnicas que se basan en variables continuas (por ejemplo, el análisis de componentes principales o PCA) con datos de marcadores. En consecuencia, solamente discutiremos brevemente las tres que aparecen enumeradas en esta diapositiva. Para entrar en más detalle acerca de los aspectos básicos de estos métodos sería necesario un buen nivel de entendimiento matemático respecto a los algoritmos involucrados, lo cual va más allá de lo que esperamos del usuario promedio de este módulo. Por tanto, animamos a nuestros lectores que deseen saber más acerca de estos métodos para que hagan búsquedas sobre métodos de ordenación en la Web. Para obtener un resumen, ingrese al sitio <http://www.okstate.edu/artsci/botany/ordinate/overview.htm>

El análisis de coordenadas principales (PCoA) pretende representar las distancias entre muestras y puede dar cabida a matrices de diferentes medidas de disimilitud. Maximiza la correlación lineal entre distancias de muestras. Cuando se emplea con las distancias euclideanas, se obtienen resultados idénticos al PCA.

El escalamiento multidimensional no métrico (NMDS) maximiza la correlación de orden y pretende encontrar la mejor forma de acomodar los datos. Esta técnica deja al descubierto la configuración básica a partir de la matriz de muestras disímiles. Cuando se emplea NMDS, sólo es pertinente el patrón de puntos, no el origen, y puede rotarse la representación.

El análisis de correspondencia (CA) repite los promedios de los puntajes de las muestras y encuentra zonas donde todas las muestras que se acomodan ahí son lo más similares posible. Al mismo tiempo, las muestras que se acomodan en zonas diferentes son lo más diferentes posible.

Page 154: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 67

f El análisis de la diversidad genética y estructura de poblaciones comprende:

• La cuantificación de la diversidad y las relaciones entre y dentro de poblaciones e individuos

• La visualización de las relaciones

f Los datos moleculares se manejan frecuentemente como datos binarios

f Es útil complementar datos moleculares con datos morfológicos o de evaluación agronómica; para hacerlo, los tipos de variables pueden transformarse en variables binarias

En resumen

Page 155: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 68

f Los pasos básicos para medir la diversidad genéticaf Las principales maneras de describir la diversidad

genética dentro de una población y entre poblaciones

f La selección correcta del cálculo de la distancia para evaluar las relaciones en la muestra de interés

f Las diferencias entre los métodos alternos de agrupación

f Las opciones disponibles para validar la agrupación f Las nociones básicas que sustentan el concepto de

ordenaciónf Las similitudes y diferencias entre agrupación y

ordenación

Hasta el momento, usted debería saber …

Page 156: Medidas de la Diversidad Genética

Referencias

Cavalli-Sforza, L.L. y W.F. Bodmer. 1981. Genética de las Poblaciones Humanas. Ed. Omega, Barcelona.

García, J.A., M.C. Duque, J. Tohme, S. Xu y M. Levy. 1995. SAS for ClassificationAnalysis: Agrobiotecnology Course, October 1995. Documento de Trabajo. Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia.

Gauch, H.G., Jr. 1982. Multivariate Analysis and Community Structure. Cambridge University Press, Reino Unido.

Karp, A., P.G. Isaac y D.S. Ingram. 1998. Molecular Tools for Screening Biodiversity: Plants and Animals. Chapman & Hall, Londres.

Lynch, M. y B.G. Milligan. 1994. Analysis of population genetic structure with RAPD markers. Mol. Ecol. 3:91-99.

Sokal, R. y J. Rohlf. 1994. Biometry: The Principles and Practice of Statistics in Biological Research (3rd edn.). Freeman & Co, NY.

Page 157: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Medidas de diversidad 69

f Programas informáticos para el análisis de la diversidad genética

f Glosario

A continuación

Page 158: Medidas de la Diversidad Genética

Apéndices

Apéndice 2. Análisis de la varianza molecular: Ejemplo 1

Apéndice 3. Análisis de la varianza molecular: Ejemplo 2

Apéndice 4. Distancia geométrica

Apéndice 5. Transformación de datos a partir de variables cuantitativas: Un ejemplo

Apéndice 6. Aplicación del coeficiente de concordancia simple a los caracteres morfológicos (variables categóricas)

Apéndice 7. Cálculo de la distancia genética de Nei

Apéndice 8. Similitudes morfológicas y moleculares

Page 159: Medidas de la Diversidad Genética

Apéndice 2 de: Medidas de la Diversidad Genética

Análisis de la varianza molecular: Ejemplo 1 Este modelo, denominado también AMOVA, mide la diversidad génica entre poblaciones, en este caso particular en áreas de una región, en un continente (situación 3, diapositiva 26). Tenemos: i = individuos, j = alelos, k = poblaciones

Yki(j) = Y + ak + bk(i) + wki(j) Donde,

Yki(j) = un valor entre 0 y 1 para el j-ésimo alelo del i-ésimo individuo de la k-ésima población

A(k) = el efecto de la k-ésima población, con varianza V2a Bk(i) = el efecto del i-ésimo individuo dentro de la k-ésima población, con

varianza V2b Wki(j) = el efecto del j-ésimo locus del i-ésimo individuo de la k-ésima

población, con varianza V2w n = el producto de i, j y k; es decir, el número total de observaciones

Fuente de variación gl SC CM CME Entre problaciones (k – 1) 6X...k2/ij – X…2/ijk CMa V2w + 2V2b + 2nV2aEntre individuos/pobl. k(i – 1) 66Xi...k2/j – 6...k2/ij CMb V2w + 2V2b Dentro de individuos ki(j – 1) 666Xijk2 – 66Xi...k2/j CMw V2w Total kij – 1 666Xijk2 – X…2/ijk

Estimaciones de la varianza y de estadísticos F V2a = FSTV

2 FIT = (V2a + V2b)/V2

V2b = (FIT – FST)V2 FST = V2a/V2

V2w = (1 – FIT)V2 FIS = V2b/(V2b + V2w)

V2 = V2w + V2b + V2a Donde,

V2a = el valor paramétrico de la varianza entre poblaciones que portan alelos idénticos. Se estima por (CMa – CMb)/2n.

V2b = el valor paramétrico de la varianza entre individuos dentro de cada población. Se estima por (CMb – CMw)/2.

V2w = el valor paramétrico de la varianza dentro de individuos o la medida de la probabilidad de que los alelos dentro de los loci sean diferentes. Se estima por el cuadrado medio dentro de individuos (CMW).

Page 160: Medidas de la Diversidad Genética

Apéndice 3 de: Medidas de la Diversidad Genética

Análisis de la varianza molecular: Ejemplo 2 Como se describe en el Apéndice 2, este modelo (AMOVA) mide la diversidad génica entre poblaciones, esta vez con referencia específica a las poblaciones dentro de un área de una región, en un continente (situación 4, diapositiva 26). Tiene un nuevo nivel jerárquico (región), con sus respectivos valores paramétricos y estimadores de los cuadrados medios. Tenemos: i = individuos, j = alelos, k = poblaciones, l = regiones

Ylki(j) = Y + rl + al(k) + blk(i) + wlki(j)Donde,

Ylki(j) = un valor entre 0 y 1 para el j-ésimo alelo del i-ésimo individuo de la k-ésima población, en la l-ésima región

rl = el efecto de la l-ésima región, con la varianza V2r al(k) = el efecto de la k-ésima población con la l-ésima región, con

varianza V2a blk(i) = el efecto del i-ésimo individuo dentro de la k-ésima población en

la l-ésima región, con varianza V2b wlki(j) = efecto del j-ésimo locus dentro del i-ésimo individuo de la

k-ésima población, de la l-ésima región, con varianza V2c n = el producto de i, j, k y l, que es el número total de observaciones

Fuente de variación gl CM CME Entre regiones l – 1 CMr V2w + 2V2b + 2nV2a + 2nlV2r Entre pobl., dentro de regiones l(k – 1) CMa V2w + 2V2b + 2nV2a Entre indiv./pobl./regiones Ik(i – 1) CMb V2w + 2V2b Dentro de individuos lki(j – 1) CMw V2w Total Ikij – 1

Varianza total (%) %V2r = (V2r/V2) 100 %V2a = (V2a /V2) 100

V2 = V2r + V2w + V2b + V2a %V2b = (V2b /V2) 100 %V2w = (V2w /V2) 100 V2r es el valor paramétrico de la varianza entre regiones y se estima por (CMA – CMB)/2nl. En las estimaciones de la varianza se agrega el signo ‘%’ porque podemos expresar la varianza calculada para cada fuente (región, población dentro de una región, individuos dentro de una población) en función de la varianza total y, como tal, podemos determinar cuál de los componentes de la variación es el más importante. Por ejemplo, si el valor de la variación originada por las regiones fue alto y los valores de las demás fuentes fueron bajos, podríamos concluir que las poblaciones dentro de las regiones tienen frecuencias alélicas homogéneas, pero que las poblaciones procedentes de diferentes regiones difieren marcadamente en sus frecuencias alélicas.

Page 161: Medidas de la Diversidad Genética

Apéndice 4 de: Medidas de la Diversidad Genética

Distancia geométrica Variables cuantitativas La distancia geométrica, conocida también como distancia taxonómica (Sokal, 1961), se mide mediante distancias euclidianas, según la fórmula que aparece a continuación:

dij = [6k(Xik – Xjk)2]1/2

Donde,

Xik = el valor de la k-ésima variable del i-ésimo individuo Consulte el Apéndice 5 si quiere ver un ejemplo de cómo de calcula esta distancia. Variables mixtas Si hay variables mixtas, primero deben ser transformadas o estandarizadas, según la fórmula que aparece a continuación:

i

iijijstand s

X-XX Donde,

Xij = el valor del i-ésimo carácter en el j-ésimo individuo CXi = el promedio para el i-ésimo carácter si = la desviación estándar para el i-ésimo carácter

Número P de variables Si hay un número P de variables, el valor de la distancia para que se vuelva independiente del número de variables, como se muestra a continuación:

P

)X-(Xd

2

k k

jkik

2ij

¦ »¼º

«¬ª

ı

Referencia Sokal, R. 1961. Distance as a measure of taxonomic similarity. Syst. Zool.

10(2):40-51.

Page 162: Medidas de la Diversidad Genética

Apéndice 5 de: Medidas de la Diversidad Genética

Transformación de datos a partir de variables cuantitativas: Un ejemplo Tenemos tres caracteres tomados en cuatro individuos:

• Altura de la planta (m) • Peso de la semilla (g) • Diámetro del grano de polen (µ)

Antes de calcular las distancias, primero debemos estandarizar los datos mediante la siguiente fórmula:

Mestand = m -Cm/V Después de la estandarización, se pierden las unidades de medida.

m Mestand g gestand µ µestand

Individuo 1 1.50 0.35 0.02 0.00 80.00 -0.15 Individuo 2 1.20 -1.41 0.03 1.00 70.00 -1.32 Individuo 3 1.45 0.06 0.01 -1.00 90.00 1.02 Individuo 4 1.60 0.94 0.02 0.00 85.00 0.44 Promedio (Xi) 1.44 � 0.02 � 81.25 �

Desviación (si) 0.17 � 0.01 � 8.54 �

Ahora se pueden calcular las distancias para cualquier par de individuos, aplicando la fórmula que ya conocemos:

dij = [6(Xij – Xkj)2]1/2

d12 = [(0.35 – (-1.41))2 + (0.0 – 1.0)2 + (-0.15 – (-1.32))2]1/2 = 2.34 d11 = 0 d13 = [(0.35 – 0.06)2 + (0.0 – (-1.0))2 + (-0.15 – 1.02)2]1/2 = 1.57 d22 = 0 d14 = [(0.35 – 0.94)2 + (0.0 – 0.0)2 + (-0.15 – 0.44)2]1/2 = 0.83 d33 = 0 d23 = [(-1.41 – 0.06)2 + (1.0 – (-1.0))2 + (-1.32 – 1.02)2]1/2 = 3.41 d44 = 0 d24 = [(-1.41 – 0.94)2 + (1.0 – 0.0)2 + (-1.32 – 0.44)2]1/2 = 3.10 d34 = [(0.06 – 0.94)2 + (-1.0 – 0.0)2 + (1.02 – 0.44)2]1/2 = 1.45

Después de obtener las distancias dos a dos, procedemos a encontrar los grupos utilizando el método UPGMA (para más detalles, ver diapositivas 58 y 59 del módulo).

Page 163: Medidas de la Diversidad Genética

En primer lugar, organizamos en un cuadro simétrico nuestros valores de distancia calculados:

I1 I2 I3 I4

I1 0

I2 2.34 0

I3 1.57 3.41 0

I4 0.83 3.10 1.45 0 En el primer ciclo, escogemos la distancia más corta. En nuestro caso es d1,4 = 0.83. Después se puede elaborar una nueva matriz agrupando el Individuo1 con el Individuo4 y calculando las distancias combinadas:

d2(1,4) = (d1,2 + d2,4)/2 = (2.34 + 3.10)/2 = 2.72 d3(1,4) = (d1,3 + d3,4)/2 = (1.57 + 1.45)/2 = 1.51

I1,4 I2 I3

I1,4 0

I2 2.72 0

I3 1.51 3.41 0 Observamos ahora que la distancia más corta está entre I1,4 y I3. En un nuevo ciclo, se elabora una nueva matriz, agrupando el Individuo2 con el grupo I(1,4)3 y calculando la distancia combinada d((1,4)3)2 = 3.07.

I1,4(3) I2

I1,4(3) 0

I2 3.07 0 Con base en los resultados que aparecen arriba, podemos proceder a trazar el dendrograma, relacionando los cuatro individuos del ejemplo:

Page 164: Medidas de la Diversidad Genética

3.00 0.02.00 1.001.50

1

4

3

2

Page 165: Medidas de la Diversidad Genética

Apéndice 6 de: Medidas de la Diversidad Genética

Aplicación del coeficiente de concordancia simple a los caracteres morfológicos (variables categóricas) Tenemos tres caracteres:

• Pubescencia foliar: escasa (1), común (2), abundante (3) • Color de los pétalos: blanco (1), amarillo (2), rojo (3) • Longitud del pecíolo: corto (1), intermedio (2), largo (3)

En primer lugar, convertimos los datos de las medidas en datos binarios. Obsérvese que los tres caracteres originales se convierten en 9 caracteres binarios. Esta operación podría darle demasiada importancia a estos caracteres, en detrimento de otros que se empleen en el análisis.

Carácter 1 Carácter 2 Carácter 3

UTO 1 2 1 2

UTO 2 2 3 3

UTO 3 1 2 1

UTO 4 3 3 1

Carácter 1 (código binario)

Carácter 2 (código binario)

Carácter 3 (código binario)

Escaso Común Abundante Blanco Amarillo Rojo Corto Intermedio Largo

UTO 1 0 1 0 1 0 0 0 1 0

UTO 2 0 1 0 0 0 1 0 0 1

UTO 3 1 0 0 0 1 0 1 0 0

UTO 4 0 0 1 0 0 1 1 0 0 Luego, aplicamos el coeficiente de concordancia simple para calcular las distancias dos a dos entre individuos:

Comparaciones dos a dos para todos los caracteres

UTO 1 vs. 2 1 0 UTO 1 vs. 3 1 0 UTO 1 vs. 4 1 0

1 a = 1 b = 2 1 a = 0 b = 3 1 a = 0 b = 3

0 c = 2 d = 4 0 c = 3 d = 3 0 c = 3 d = 3

UTO 2 vs. 3 1 0 UTO 2 vs. 4 1 0 UTO 3 vs. 4 1 0

1 a = 0 b = 3 1 a = 1 b = 2 1 a = 1 b = 2

Page 166: Medidas de la Diversidad Genética

0 c = 3 d = 3 0 c = 2 d = 4 0 c = 2 d = 4

Ahora, podemos proceder con el método para encontrar los grupos y dibujar el fenograma correspondiente:

O1 O2 O3 O4

O1 0

O2 0.56 0

O3 0.33 0.33 0

O4 0.33 0.56 0.56 0

Coeficiente

0.25 0.44 0.81 1.00

1

2

3

4

Fenograma

0.63

Page 167: Medidas de la Diversidad Genética

Apéndice 7 de: Medidas de la Diversidad Genética

Cálculo de la distancia genética de Nei En primer lugar, elaboramos la matriz de distancia con los datos obtenidos en el ejemplo (ver diapositiva 48), de la siguiente manera:

P1 P2 P3

P1 0

P2 0.0852 0

P3 0.0107 0.0440 0

En el primer ciclo, escogemos la distancia más corta: d1,3 = 0.0107. En el segundo ciclo, se elabora una nueva matriz agrupando el Individuo1 con el Individuo4 y calculando las distancias combinadas:

d2(1,3) = (d1,2 + d2,3)/2 = (0.0852 + 0.044)/2 = 0.0646 Ahora podemos dibujar el dendrograma:

P1,3 P2

P1,3 0

P2 0.0646 0

0.07 0.04 0.05 0.06 0.03 0.08 0.0 0.01 0 .02

1

3

2

Page 168: Medidas de la Diversidad Genética

Apéndice 8 de: Medidas de la Diversidad Genética

Similitudes morfológicas y moleculares

Individuo2Individuo1 Individuo3

ADN

2 1 3 4 5

6 7 8

9 10

11 12

9 + 10

7 + 8 6

1 1

9 10

1211

8

5 21 3 4

6

22

7

5 3 + 4 2

1211

Digamos que tenemos tres rosas individuales (1, 2, 3). Morfológicamente, los números 2 y 3 se parecen, en tanto que el número 1 se ve diferente. Si observamos los fragmentos de ADN, generados supuestamente con un marcador molecular, vemos que los individuos 2 y 3 parecen ser más similares. Entonces, ¿qué sucedió? Esto apunta a la importancia de estudiar la diversidad genética en todos los niveles posibles. La combinación de información procedente de diferentes tipos de marcadores —es decir, los de los genes funcionales y aquellos que muestran polimorfismo en regiones genómicas— proveerá la mejor aproximación posible al conocimiento sobre la variación genética presente. Se aplicaría el mismo principio si pudiéramos combinar datos morfológicos y moleculares. En este Apéndice señalamos el tipo de errores en que podemos incurrir si las conclusiones se basan solamente en un tipo de datos de marcadores.

Page 169: Medidas de la Diversidad Genética

a = 11 b = 1

c = 2 d = 3Indi

v. 1

Indiv. 2 Con base en el perfil de bandas de ADN obtenido en el gel para los tres individuos, se calculan las distancias dos a dos, utilizando el coeficiente de Jaccard: Luego, elaboramos la matriz de distancia y dibujamos el dendrograma:

Ind1 Ind2 Ind3

Ind 1

1

Ind 2

0.786 1

Ind 3

0.400 0.294 1

Ind12 Ind3

Ind 12

1

Ind 3

0.347 1

cba

aJ

� �

a = 5 b = 8

c = 4 d = 0Indi

v. 2

Indiv. 3

a = 6 b = 6

c = 3 d = 2Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

67

9

10

1112

1

22

2

3+4

7+8

9+10

a = 11 b = 1

c = 2 d = 3Indi

v. 1

Indiv. 2

a = 5 b = 8

c = 4 d = 0Indi

v. 2

Indiv. 3

a = 6 b = 6

c = 3 d = 2Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

67

9

10

1112

1

22

2

3+4

7+8

9+10

0.7862111

111,2

�� 0.400

3666J1, 3 ��

0.294485

5J2,3 ��

J

0.342

S 2S1,3 S 1,2,

,3

3

� 1,3 2,3 S1,2,3

S S���

20.347

Page 170: Medidas de la Diversidad Genética

Este dendrograma se obtuvo a partir de los datos moleculares. Ahora, podemos compararlo con otro dendrograma que aparece a continuación, que fue obtenido a partir de observaciones morfológicas, y ver cómo difieren entre sí. Según el dendrograma molecular, los individuos 1 y 2 se encuentran más cercanos entre sí, aun cuando los datos morfológicos indican que los Individuos 2 y 3 son más cercanos. Podemos también usar una combinación de datos moleculares y morfológicos, volviendo a realizar el proceso con ambos datos simultáneamente.

a = 11 b = 2

c = 2 d = 3

In

div.

1

Indiv. 2

a = 6 b = 8

c = 4 d = 0

Indi

v. 2

Indiv. 3

a = 6 b = 7

c = 3 d = 2

Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

6

7

8

9

10

11

12

1

22

2

3+4

7+8

9+10

a = 11 b = 2

c = 2 d = 3

Indi

v. 1

Indiv. 2

a = 6 b = 7

c = 3 d = 2

a = 6 b = 8

c = 4 d = 0

Indi

v. 2

Indiv. 3

Indi

v. 1

Indiv. 3

Ind.1 Ind.2 Ind.3

21

3

4

5

6

7

8

9

10

11

12

1

22

2

3+4

7+8

9+10

0.0 1.00.8 0.6 0.4 0.2

Ind3

Ind2

Ind1

0.0 1.0

Ind 1 I 1

Ind2

Ind3

Ind1

Dendrograma morfológico

Dendrograma molecular

Page 171: Medidas de la Diversidad Genética

El dendrograma combinado indica distancias de agrupación que difieren del dendrograma molecular y del dendrograma morfológico, considerados por separado. En consecuencia, podemos asumir que la información provista al combinar los datos está más cerca de la realidad de la situación.

733.02211

11J1,2 ��

375.0376

6J1,3 ��

333.0486

6J2,3 ��

Ind3Ind2Ind1

Ind3

Ind2

Ind1 10.733 10.375 0.333 1

Ind3Ind2Ind1

Ind3

Ind2

Ind1 10.733 10.375 0.333 1

1

0.554 1

Ind3Ind12

Ind 3

Ind 1

2

0.5542

SSS 2,31,3(1,2)3

1

0.554 1

Ind3Ind12

Ind 3

Ind 1

2

0.5542

SSS 2,31,3(1,2)3

Ind1

Ind3

0.2 0.4 0.6 0.8 1.0

Ind2

0.0

Page 172: Medidas de la Diversidad Genética

Apéndice 9 de: Programas Informáticos para el Análisis de la Diversidad Genética

Referencias a los programas informáticos Arlequin Schneider, S., D. Roessli y L. Excoffier. 2000. Arlequin: A Software for Population

Genetics Data Analysis, Versión 2.000. Laboratorio de Genética y Biometría, Dept. de Antropología, Universidad de Ginebra, Suiza.

CLUSTAL W Thompson, J.D., D.G. Higgins y T.J. Gibson. 1994. CLUSTAL W: improving the

sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22:4673-4680.

DnaSP Rozas, J. y R. Rozas. 1995. DnaSP, DNA sequence polymorphism: an interactive

program for estimating population genetics parameters from DNA sequence data. Comput. Appl. Biosci. 11:621-625.

GDA Lewis, P.O. y D. Zaykin. 1999. Genetic Data Analysis: Computer Program for the

Analysis of Allelic Data, Versión 1.0 (d12). Distribuido por los autores. GENEPOP Raymond, M. y F. Rousset. 1995. GENEPOP (versión 1.2): Population genetics

software for exact tests and ecumenicism. J. Hered. 86:248-249. GeneStrut Constantine, C.C., R.P. Hobbs y A.J. Lymbery. 1994. FORTRAN programs for

analysing population structure from multilocus genotype data. J. Hered. 85:336-337.

MacClade Maddison, D.R. y W.P. Maddison. 2000. MacClade. Versión 4. Sinauer

Associates, Sunderland, MA. MALIGN Janies, D. y W.C. Wheeler. 1998. MALIGN.pdf: Documentation for MALIGN,

software for multiple alignments of DNA sequences. Distribuido por los autores en la Internet en <ftp://ftp.amnh.org/pub/molecular/malign/>.

Page 173: Medidas de la Diversidad Genética

MEGA2 Kumar, S., K. Tamura, I.B. Jakobsen y M. Nei. 2001. MEGA2: Molecular

Evolutionary Genetics Analysis software. Bioinformatics 17(12):1244-1245. NTSYSpc Rohlf, F.J. 2002. NTSYS pc: Numerical Taxonomy System, Version 2.1. Exeter

Publishing, Setauket, NY. PAUP* Swofford, D.L. 2002. PAUP*: Phylogenetic Analysis Using Parsimony (*and Other

Methods), Versión 4. Sinauer Associates, Sunderland, MA. PHYLIP Felsenstein, J. 1993. PHYLIP (Phylogeny Inference Package), Versión 3.5c.

Distribuido por el autor. POPGENE Yeh, F.C., R.C. Yang, T.B.J. Boyle, Z.H. Ye y J.X. Mao. 1997. POPGENE, the

User-Friendly Shareware for Population Genetic Analysis. Centro de Biología Molecular y Biotecnología, Universidad de Alberta, Canadá.

PowerMarker Liu, J. 2003. PowerMarker: New Genetic Data Analysis Software, Versión 1.0.

Programa distribuido por el autor en forma gratuita en la Internet en <http://www.powermarker.net>

SITES Hey, J y J. Wakeley. 1997. A coalescent estimator of the population

recombination rate. Genetics 145:833-846. structure Pritchard, J.K., M. Stephens y P. Donnelly. 2000. Inference of population

structure using multilocus genotype data. Genetics 155:945-959. TFPGA Miller, M.P. 1997. Tools for Population Genetic Analysis (TFPGA), 1.3: A

Windows Program for the Analysis of Allozyme and Molecular Population Genetic Data. Distribuido por el autor.

Page 174: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 1

Programas informáticos para el análisis de la diversidad

genética

Análisis de la diversidad genética utilizando datos de marcadores moleculares:

Módulo de aprendizaje

Page 175: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 2

Características principales• Un cuadro resumen• Algunos programas informáticos, sus autores,

sitio en la Web …• … y otras características

Cinco programas informáticos, en detalle• Arlequin• PowerMarker• DnaSP• PAUP*• MEGA

Recursos en la InternetApéndice 9: Referencias a los programas informáticos

Contenido

Page 176: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 3

Atributos similares

Diferencias clave• Interfase de usuario• Tipo de ingreso y salida de datos• Sistema operativo• Capacidades

Selección con base en las preferencias individuales

Características principales

Existen numerosos programas informáticos para evaluar la diversidad genética. La mayoría se pueden obtener de forma gratuita en la Internet. Muchos desempeñan funciones similares, con las siguientes diferencias: la interfase de usuario, el tipo de ingreso y salida de datos, y el sistema operativo. En estos términos, la selección del programa a usar depende, en gran medida, de preferencias individuales. En esta sección, describimos algunos de los programas disponibles, indicando las opciones específicas que los usuarios pueden preferir.

Page 177: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 4Según Labate (2000)

CaracterísticaTFPGA1 Arlequin1* GDA1 GENEPOP1* GeneStrut POPGENE*+

DiversidadHeterocigosidad observada x x x x xHeterocigosidad esperada x x x x xNo. de alelos por locus x x x xAlelos efectivos (no.) x x xPorcentaje de loci polimorfos x x x xShannon-Weaver

Estructura de la poblaciónEstadísticos F x x x x x xEstadísticos G x xANOVA x xEstadísticos Rho x xHomogeneidad x x xMigración x x xAislamiento por distancia x

EquilibrioHardy-Weinberg x x x x x xDos locus x x x x xMultiloci xPrueba U x

Distancia genéticade Nei x x x x xde Rogers x xDos a Dos Fsr x x x

AgrupaciónUnión al vecino xUPGMA x x x xPrueba de neutralidad x x1 Realiza pruebas exactas para significación* El programa puede aceptar un alelo nulo en los datos+El usuario puede especificar un coef. de endogamia para estimar la frecuencia de un alelo nulo

Programa

Un cuadro resumen

Joanne Labate (2000) escribió una revisión excelente de seis programas: TFPGA (Miller, 1997), Arlequin (Schneider et al., 1997), GDA (Lewis y Zaykin, 1999), GENEPOP (Raymond y Rousset, 1995), GeneStrut (Constantine et al., 1994) y POPGENE (Yeh et al., 1997). Su revisión incluye las opciones específicas de cada programa, un cuadro de las funciones de que dispone cada uno y los sitios en la Web de donde pueden bajarse. Para evitar la redundancia, solamente hemos incluido Arlequin que, de los seis, es posiblemente el programa más ampliamente usado.

Para las referencias completas de estos seis programas y otros que hemos seleccionado, remítase al Apéndice 9 (haga clic aquí).

Referencia

Labate, J.A. 2000. Software for population genetic analyses of molecular marker data. Crop Sci. 40:1521-1528.

Page 178: Medidas de la Diversidad Genética

numbat

Page 179: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 6

Windows Macintosh OtrosArlequin X X X 0DnaSP X c 0PowerMarker X 0MEGA2 X c c 0Arlequin X X X 100TFPGA X 0GDA X X 0GENEPOP X 0NTSYSpc X 230-300structure X X 0GeneStrut X 0POPGENE X c 0MacClade X 125PHYLIP X X X 0SITES X X 0CLUSTAL W X X X 0MALIGN X 0

Sistema operativo Costo (US$)Nombre

… y otras características

c = el programa trabaja bien con un emulador como SoftWindows o VirtualPC.

Para ahorrar espacio, en el Apéndice 9 se presentan las referencias a los programas tratados (haga clic aquí).

Page 180: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 7

Arlequin

PowerMarker

DnaSP

PAUP*

MEGA

Cinco programas informáticos, en detalle

Se seleccionaron cinco programas informáticos para presentarlos en detalle. La selección se hizo después de realizar un encuesta informal entre usuarios acerca de los programas que más usan y sus opiniones en cuanto a su utilidad o representatividad. Los usuarios abarcaron estudiantes de pregrado y posgrado, asociados de investigación y docentes. Se compiló una lista de los programas que más se mencionaron. En casos de duda, se escogieron aquellos programas que estaban disponibles en forma gratuita o que parecían ser los más ampliamente usados. Para mayor representatividad, un criterio adicional fue el de escoger programas que realizaban funciones diversas.

Page 181: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 8

<http://lgb.unige.ch/arlequin>Disponible en versiones para Windows, Mac y Linux, todas gratuitasPuede emplear diferentes tipos de datos (pero aún no los de marcadores dominantes)Pueden incluirse datos ausentes o ambiguosLos datos pueden ingresarse como secuencias de ADN, haplotipos de RFLP, perfiles de microsatélites o haplotipos de múltiples lociLos datos pueden importarse de archivos creados por otros programas

Arlequin

(continúa en la siguiente)

El programa Arlequin (versión actual 2001), liberado en 1997, todavía es muy popular. Consiste en 'un ambiente de programa informático tipo explorador en genética de poblaciones, capaz de manejar grandes muestras de datos moleculares (RFLP, secuencias de ADN, microsatélites), mientras que conserva la capacidad de analizar datos genéticos convencionales (datos estándar de múltiples loci o los meros datos de frecuencia alélica).

Arlequin puede usar muchos tipos diferentes de datos, tales como datos moleculares y frecuencias genotípicas o haplotípicas, incluyendo datos codominantes o recesivos, pero no todavía datos dominantes. Los datos moleculares pueden ser entrados como secuencias de ADN, haplotipos de RFLP, perfiles de microsatélites o haplotipos de múltiples loci. El formato de datos se especifica en un archivo de entrada. El usuario puede crear un archivo de datos desde el principio, utilizando un editor de texto y palabras clave apropiadas, o utilizando el 'Project Outline Wizard'. Los datos pueden importarse de los archivos creados por otros programas, incluyendo MEGA, BIOSYS, GENEPOP y PHYLIP. Pueden existir datos ausentes o ambiguos. Existe un manual de usuario muy detallado, que incluye una gran cantidad de información teórica, fórmulas y referencias. Este programa tiene la capacidad de analizar una cantidad importante de datos y hay una opción “Batch Files”(archivo por tandas) disponible.

Autores: Laurent Excoffier, Stefan Schneider y David Roessli, Universidad de Ginebra, Suiza.

Referencia

Schneider, S., D. Roessli y L. Excoffier. 2000. Arlequin: A Software for PopulationGenetics Data Analysis, Version 2.000. Laboratorio de Genética y Biometría, Departamento de Antropología, Universidad de Geneva, Suiza.

Page 182: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 9

Ventajas:• Apoyo adecuado a través de un manual detallado,

que incluye suficiente información teórica, fórmulas y referencias; tiene, además, un sitio bien organizado en la Web con secciones especializadas como ‘Preguntas más frecuentes’

• La interfase de gráficos es muy fácil de usarDesventajas:

• Hay que aprenderse muchas características y opciones

• Organizar el archivo de datos puede ser una labor compleja y debe ser formateado correctamente (sin embargo, en el manual se incluyen ejemplos claros)

Arlequin (continuación)

Page 183: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 10

<http://www.powermarker.net>

Diseñado para ser usado con datos de SSR/SNP en análisis de genética de poblaciones

Las opciones disponibles incluyen un resumen estadístico, árboles de consenso, estructura de poblaciones, prueba de Mantel, trazado en triángulo y visualización de resultados de desequilibrio de ligamiento

PowerMarker

(continúa en la siguiente)

El programa PowerMarker es nuevo. La primera versión oficial fue liberada en enero del 2004. Fue diseñado específicamente para el uso de datos de SSR/SNP, en el análisis de la genética de poblaciones. Los datos pueden importarse de Excel o de otros formatos, lo que hace que la organización de datos sea una operación muy sencilla. Los datos también pueden exportarse a los formatos NEXUS y Arlequin. Incluye un 'visor 2D' para visualizar el desequilibrio de ligamiento. El usuario puede editar los gráficos dentro de PowerMarker o exportarlos para imprimir. Existe un manual con guía de autoaprendizaje. El programa es gratuito, pero requiere tener PHYLIP, TreeView y el sistema de esquemas Microsoft.net(todos disponibles en forma gratuita) y Excel 2000 (no es gratuito). Otra desventaja es que está disponible solamente para Windows 98 y versiones más recientes (no para Macintosh ni para otros sistemas).

Autor: Kejun (Jack) Liu, Universidad del Estado de Carolina del Norte.

Referencia

Lui, K. 2003. PowerMarker: New Genetic Data Analysis Software, Version1.0. Programa gratuito distribuido por el autor en la Internet en <http://powermarker.net>

Page 184: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 11

Ventajas:• Permite importar datos de Excel, lo que hace que el

manejo de datos sea muy sencillo• Las interfases de gráficos son muy fáciles de usar• Los gráficos tienen ‘garantizada’ la calidad de

publicación

Desventajas:• Programa muy nuevo con posibles fallos que deben

ser subsanados• No es un programa que pueda ser usado solo;

necesita que se bajen otros programas informáticos y hay que comprar Excel

PowerMarker (continuación)

Page 185: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 12

<http://www.ub.es/dnasp>Utiliza datos de secuencias de ADN para realizar análisis de genética de poblacionesRealiza gran número de análisis, incluyendo medida de polimorfismo, divergencia entre poblaciones (con medida de flujo génico), substituciones sinónimas y no sinónimas, desequilibrio de ligamiento, recombinación, y varias pruebas estadísticas (de Hudson, de Kreitman y Aguade, de Fu y Li, de Tajima, y la prueba de McDonald y Kreitman)

DnaSP

(continúa en la siguiente)

El programa DnaSP, para el Polimorfismo de Secuencias de ADN, utiliza datos de secuencia de ADN. Este programa se usa ampliamente para el análisis de secuencias porque realiza todos los análisis necesarios y, al mismo tiempo, es fácil de manejar. Se escribió exclusivamente para el sistema operativo Windows, pero puede ser ejecutado en un Macintosh mediante los emuladores SoftWindows o VirtualPC. DnaSP puede importar y exportar varios tipos de formatos de datos, incluyendo FASTA y NEXUS, lo cual es muy conveniente. Puede manejar grandes cantidades de secuencias largas, dependiendo de la memoria del computador. Los autores están trabajando actualmente en la versión 4. Estádisponible en forma gratuita y se puede bajar del sitio en la Web. Aunque no hay manual disponible, hay un archivo de Ayuda incorporado en el programa. Además, en el sitio Web se incluye mucho material explicativo, así como numerosas referencias. Los autores han preparado varias publicaciones acerca del programa (por ejemplo, remitirse a las citas que aparecen a continuación).

Autores: Julio y Ricardo Rozas

Referencias

Rozas, J. y R. Rozas. 1995. DnaSP, DNA sequence polymorphism: an interactiveprogram for estimating population genetic parameters from DNA sequence data. Comput. Appl. Biosci. 11:621-625.

Rozas, J. y R. Rozas. 1997. DnaSP version 2.0: a novel software package forextensive molecular population genetics analysis. Comput. Appl. Biosci. 13:307-311.

Rozas, J. y R. Rozas. 1999. DnaSP version 3: an integrated program for molecular population genetics and molecular evolution analysis. Bioinformatics 15:174-175.

Page 186: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 13

Ventajas:• La interfase de usuario en Windows hace que el

programa sea muy fácil de usar• Permite un gran número de análisis

Desventajas:• Actualmente está disponible sólo para usuarios de

Windows (y Macintosh, con el uso de un emulador de Windows)

• Todavía no se dispone de un manual de instrucciones o de una guía de autoaprendizaje

• Aparentemente, aún no cuenta con un servicio de apoyo técnico

DnaSP (continuación)

Page 187: Medidas de la Diversidad Genética

/

Page 188: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 15

Ventaja:Dispone de un buen apoyo técnico tanto en línea (incluye una lista completa de ‘Preguntas más frecuentes’) como a través del correo electrónico

Desventaja:No es gratuito

PAUP* (continuación)

Page 189: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 16

<http://www.megasoftware.net/>

Utiliza datos de secuencia de ADN, secuencias de proteínas, distancia evolutiva o de árboles filogenéticos

Permite numerosos métodos de análisis, entre los cuales están cálculos de distancia, estructuras de árbol y muchas maneras de visualizar datos

MEGA

(continúa en la siguiente)

El programa MEGA (Molecular Evolutionary Genetics Analysis) ha sido ampliamente utilizado desde su creación en 1993. Ya salió MEGA2. Utiliza datos de secuencia de ADN, secuencias de proteínas, y distancia evolutiva o de árboles filogénicos. El objetivo de los autores fue el de aprovechar los adelantos en la capacidad de los computadores y las interfases gráficas para proporcionar una ‘plataforma de trabajo de análisis de datos genéticos que sea flexible y fácil de usar'. Aunque fue diseñado para el sistema operativo Windows, funciona bien en Macintosh con un emulador de Windows, una terminal Sun (con SoftWindows95) o Linux (con Windows por VMWare). La versión más reciente, 2.1, tiene muchas adiciones importantes, como la capacidad para importar datos de NEXUS o CLUSTAL W, tamaños ilimitados de series de datos y muchos otros.

Un libro escrito por Nei y Kumar (2000), los autores de ese programa, aporta información teórica acerca de los análisis estadísticos y la manera de interpretar los resultados de su programa informático y otros. Hay un manual exhaustivo disponible en línea (aunque no es fácil recorrer el formato), junto con una cartelera para que los usuarios interactúen entre sí.

Autores: Sudhir Kumar, Koichiro Tamura, Ingrid Jakobsen y Masatoshi Nei.

Referencias

Nei, M y S. Kumar. 2000. Molecular Evolution and Phylogenetics. Oxford UniversityPress, NY.

Sudhir, K., T. Koichiro, I. B. Jakobsen y M. Nei. 2001. MEGA2: Molecular Evolutionary Genetics Analysis software. Bioinformatics 12 (17):1244-1245.

Page 190: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 17

Ventajas:• Como este programa informático salió al mercado

en 1993, es probable que ya se hayan descubierto la mayor parte de sus fallos

• Cuenta con un buen apoyo técnico, que incluye un manual en línea y un texto impreso

Desventaja:• Para principiantes no es un programa sencillo de

usar

MEGA (continuación)

Page 191: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 18

Sitio del Laboratorio Europeo de Biología Molecular–Instituto Europeo de Bioinformática (EBI, por su sigla en inglés) <http://www.ebi.ac.uk/services/>

Página de programas informáticos de tipo biológico, del Instituto Pasteur en Francia <http://bioweb.pasteur.fr/intro-uk.html>

Programas de filogenia (lista elaborada por JoeFelsenstein de la Universidad de Washington) <http://evolution.genetics.washington.edu/phylip/software.html>

Recursos en la Internet

(continúa en la siguiente)

En esta diapositiva y en la siguiente, presentamos una lista con recursos que se encuentran en la Internet que le pueden ser útiles para ubicar, por ejemplo, información relacionada con el análisis de la diversidad genética, la genética de poblaciones, otros programas informáticos disponibles y enlaces con información adicional de utilidad. Para cada recurso presentado, describimos brevemente su contenido en las notas que siguen.

• El sitio del Laboratorio Europeo de Biología Molecular-Instituto Europeo de Bioinformática (EBI, su sigla en inglés) no sólo contiene enlaces a muchos programas útiles y otros sitios, sino que también describe sus respectivas funciones y, en consecuencia, es una buena fuente de información general.

• La página de programas informáticos de tipo biológico del Instituto Pasteuren Francia brinda una lista bastante exhaustiva y actualizada (última actualización, diciembre de 2002) de los programas informáticos disponibles en línea, incluyendo enlaces. Un inconveniente es que algunas de laspáginas están sólo en francés. También contiene enlaces a muchos programas desarrollados en el Instituto Pasteur.

• Programas de filogenia es la lista más larga de programas de filogenia que hemos visto: asciende a 194. El autor advierte que no ha tratado de evaluar su calidad ni su costo. La lista tampoco se ha actualizado desde 2001, pero contiene tantos enlaces con programas y los ordena de diversas maneras (por ejemplo, por métodos, por sistema empleado), que sigue siendo muy útil.

Page 192: Medidas de la Diversidad Genética
Page 193: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 20

Existen muchos programas informáticos para analizar la diversidad genética con datos molecularesLa mayoría de programas realizan funcionessimilares y sus principales diferencias deben ser evaluadas, según los recursos disponibles y las preferencias individuales, o ambosHoy en día, además de contar con programas informáticos gratuitos, en la Internet también hay numerosos recursos que nos ayudan a obtener información tanto básica como especializada sobre métodos

En resumen

Page 194: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 21

Estar familiarizado con:• Las características contrastantes de los programas

informáticos disponibles para analizar la diversidad genética

• Las ventajas y desventajas de algunos de los programas informáticos más importantes

Estar al tanto de algunos recursos en la Internet que le pueden ser de ayuda en el estudio de la diversidad genética

Hasta el momento, usted debería …

Page 195: Medidas de la Diversidad Genética

Referencias

Labate, J. A. 2000. Software por population genetic analyses of molecular markerdata. Crop. Sci, 40:1521-1528.

Lui, K. 2003. PowerMarker: New Genetic Data Analysis Software, Version 1.0. Programa distribuido en forma gratuita por el autor en la Internet en <http://www.powermarker.net>

Maddison, D. R., D. L. Swofford y W. P. Maddison: 1997. NEXUS. An extensible file format for systematic information. Syst. Biol. 46:590-621.

Nei, M. y S. Kumar. 2000. Molecular Evolution and Phylogenetics: Oxford UniversityPress, NY.

Rozas, J. y R. Rozas. 1995. DnaSP, DNA sequence polymorphism: an interactiveprogram for estimating population genetics parameters from DNA sequencedata. Comput. Appl. Biosci. 11:621-625

Rozas, J. y R. Rozas. 1997. DnaSp, version 2.0: a novel software package forextensive molecular population genetics analysis. Comput. Appl. Biosci. 13:307-311.

Rozas, J. y R. Rozas. 1999. DnaSP, version 3: an integrated program for molecular population genetics and molecular evolution analysis. Bioinformatics 15:174-175.

Schneider, S., D. Roessli y L. Excoffier. 2000. Arlequin: A Software for PopulationGenetics Data Analysis, Version 2.000. Laboratorio de Genética y Biometría, Depto. de Antropología, University of Geneva, Suiza.

Sudhir, K., YT. Koichiro, I. B. Jakobsen y M. Nei. 2001. MEGA2: Molecular Evolutionary Genetics Analysis software. Bioinformatics 12(17):1244-1245.

Swofford, D. L. 2002. PAUP*, Phylogenetic Analysis Using Parsimony (*and OtherMethods), Version 4. Sinauer Associates, Sunderland, MA.

Page 196: Medidas de la Diversidad Genética

Derechos de Autor: IPGRI y Cornell University, 2004 Programas informáticos 22

Glosario

A continuación

Page 197: Medidas de la Diversidad Genética

Apéndice 9 de:Programas Informáticos para el Análisis de la Diversidad Genética

Referencias a los programas informáticos

Arlequin

Schneider, S., D. Roessli y L. Excoffier. 2000. Arlequin: A Software for Population Genetics Data Analysis, Versión 2.000. Laboratorio de Genética y Biometría, Dept. de Antropología, Universidad de Ginebra, Suiza.

CLUSTAL W

Thompson, J.D., D.G. Higgins y T.J. Gibson. 1994. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22:4673-4680.

DnaSP

Rozas, J. y R. Rozas. 1995. DnaSP, DNA sequence polymorphism: an interactive program for estimating population genetics parameters from DNA sequence data. Comput. Appl. Biosci. 11:621-625.

GDA

Lewis, P.O. y D. Zaykin. 1999. Genetic Data Analysis: Computer Program for the Analysis of Allelic Data, Versión 1.0 (d12). Distribuido por los autores.

GENEPOP

Raymond, M. y F. Rousset. 1995. GENEPOP (versión 1.2): Population genetics software for exact tests and ecumenicism. J. Hered. 86:248-249.

GeneStrut

Constantine, C.C., R.P. Hobbs y A.J. Lymbery. 1994. FORTRAN programs for analysing population structure from multilocus genotype data. J. Hered. 85:336-337.

MacClade

Maddison, D.R. y W.P. Maddison. 2000. MacClade. Versión 4. Sinauer Associates, Sunderland, MA.

MALIGN

Janies, D. y W.C. Wheeler. 1998. MALIGN.pdf: Documentation for MALIGN, software for multiple alignments of DNA sequences. Distribuido por los autores en la Internet en <ftp://ftp.amnh.org/pub/molecular/malign/>.

IV. Programas informáticos.pdf 24IV. Programas informáticos.pdf 24 7/20/2007 2:57:06 PM7/20/2007 2:57:06 PM

Page 198: Medidas de la Diversidad Genética

MEGA2

Kumar, S., K. Tamura, I.B. Jakobsen y M. Nei. 2001. MEGA2: Molecular Evolutionary Genetics Analysis software. Bioinformatics 17(12):1244-1245.

NTSYSpc

Rohlf, F.J. 2002. NTSYS pc: Numerical Taxonomy System, Version 2.1. Exeter Publishing, Setauket, NY.

PAUP*

Swofford, D.L. 2002. PAUP*: Phylogenetic Analysis Using Parsimony (*and Other Methods), Versión 4. Sinauer Associates, Sunderland, MA.

PHYLIP

Felsenstein, J. 1993. PHYLIP (Phylogeny Inference Package), Versión 3.5c. Distribuido por el autor.

POPGENE

Yeh, F.C., R.C. Yang, T.B.J. Boyle, Z.H. Ye y J.X. Mao. 1997. POPGENE, the User-Friendly Shareware for Population Genetic Analysis. Centro de Biología Molecular y Biotecnología, Universidad de Alberta, Canadá.

PowerMarker

Liu, J. 2003. PowerMarker: New Genetic Data Analysis Software, Versión 1.0. Programa distribuido por el autor en forma gratuita en la Internet en <http://www.powermarker.net>

SITES

Hey, J y J. Wakeley. 1997. A coalescent estimator of the population recombination rate. Genetics 145:833-846.

structure

Pritchard, J.K., M. Stephens y P. Donnelly. 2000. Inference of population structure using multilocus genotype data. Genetics 155:945-959.

TFPGA

Miller, M.P. 1997. Tools for Population Genetic Analysis (TFPGA), 1.3: A Windows Program for the Analysis of Allozyme and Molecular Population Genetic Data. Distribuido por el autor.

IV. Programas informáticos.pdf 25IV. Programas informáticos.pdf 25 7/20/2007 2:57:06 PM7/20/2007 2:57:06 PM

Page 199: Medidas de la Diversidad Genética

Análisis de la diversidad genética utilizando datos de marcadores moleculares:

Módulo de aprendizaje

Glosario ADN microsatélite: Tipo de ADN repetitivo, que consiste en repeticiones muy cortas, tales como dinucleótidos, trinucleótidos o tetranucleótidos. Denominado también repeticiones de secuencia simple (SSR). AFLP: Polimorfismo de longitud de fragmentos amplificados. Es un método muy sensible para detectar polimorfismos del ADN. Primero se somete el ADN a digestión con dos enzimas de restricción; luego se selecciona un subconjunto de los fragmentos de ADN que resultan de la digestión para que sean amplificados en la PCR y, finalmente, visualizados. Alelo: Una de las formas alternas de un gen que puede existir en un locus. Alelos múltiples: La existencia de varios alelos conocidos de un gen. Alogamia: La transferencia del polen (es decir, la polinización) desde la antera de la flor de una planta al estigma de la flor de una planta genéticamente diferente. Ver también Polinización cruzada. AMOVA: El análisis de la varianza molecular es un método para estudiar la variación molecular dentro de una especie. Autofecundar: Fertilizar a través del polen de la misma planta. Autogamia: • Transferencia del polen (polinización) desde la antera de una flor al estigma

de la misma flor o, a veces, al de una flor genéticamente idéntica (o sea, de la misma planta o del mismo clon).

• La habilidad que tienen muchas especies vegetales de lograr con éxito la fertilización natural de ellas mismas. Se llama también autopolinización.

Autopolinización: Ver Autogamia. Caracterización: La evaluación de los caracteres de la planta que son altamente hereditarios, que se pueden apreciar fácilmente a la vista, expresados por igual en todos los entornos, y que se pueden utilizar para diferenciar fenotipos.

Page 200: Medidas de la Diversidad Genética

Colección (de recursos fitogenéticos): • La reunión de especies domesticadas (razas nativas, cultivares antiguos y

modernos y líneas mejoradas) y especies silvestres o asilvestradas relacionadas.

• El material reunido mediante el acto de recolección se denomina una colección.

Conservación: El manejo del uso de la biosfera para que pueda producir el mayor beneficio sostenible a las generaciones actuales mientras se conserva su potencial para satisfacer las necesidades y aspiraciones de las generaciones futuras. En estos términos, la conservación es positiva; abarca la preservación, el mantenimiento, el uso sostenible, la restauración y el mejoramiento del ambiente natural. Conservación ex situ: • Método de conservación que implica la remoción de los recursos de

germoplasma (semilla, polen, esperma, organismos individuales) de su hábitat original o de su ambiente natural.

• Es la acción de mantener vivos los componentes de la diversidad biológica fuera de su hábitat original o de su ambiente natural.

• Ver Conservación in situ. Conservación in situ: Es un método de conservación que pretende preservar la integridad genética de los recursos genéticos manteniéndolos dentro de los ecosistemas en evolución dinámica del hábitat original o del ambiente natural. Ver Conservación ex situ. Deriva genética: Es un cambio impredecible en la frecuencia alélica que se produce en poblaciones pequeñas. Diploide: Una dotación completa de material genético, que consta de pares de cromosomas, cada uno proveniente de un progenitor. La mayoría de las células animales, excepto el gameto, tienen una dotación diploide de cromosomas.

er Haploide. V Distancia genética: El grado de afinidad entre subgrupos o poblaciones estimado mediante diversos estadísticos. Diversidad biológica: La totalidad de genes, especies y ecosistemas en una región dada, sea ésta un microhábitat o el mundo. Se llama también biodiversidad. Diversidad de especies: Es una función de la distribución y abundancia de las especies. Su significado es similar a ‘riqueza de especies’. En la literatura más técnica, incluye consideraciones sobre la uniformidad de la abundancia de especies. Según la definición más técnica, se dice que un ecosistema es más diverso si las especies presentes tienen poblaciones de igual tamaño y que es

enos diverso si muchas especies son raras y algunas son muy comunes. m Diversidad genética: Es la variación en la composición genética de los individuos dentro de la especie o entre especies diferentes; es la variación

enética hereditaria dentro de las poblaciones y entre ellas. g

Page 201: Medidas de la Diversidad Genética

Domesticación: La evolución de las plantas o los animales, de manera natupor selección artificial,

ral o hacia formas más útiles para el hombre; por ejemplo,

emilla indehiscente.

ón e progenitores que pertenecen al mismo patrón. Ver Polinización cruzada.

que reconoce una secuencia específica y orta la cadena de ADN en ese punto.

de

l azar en ausencia de mutación, migración, selección natural o eriva al azar.

, con el transcurso del tiempo, o reducción de la ase genética de una especie.

ra la historia volutiva deducida de las poblaciones de organismos relacionados.

a

troducción de nuevas variedades de cultivos por parte de los agricultores.

te que

ción transcrita y un elemento regulador que permite su anscripción.

nos y

istribuciones de frecuencia, medias, varianza y desviaciones estándar.

enoma: Todo la dotación de material genético en un organismo.

pleta

cada óvulo y célula polínica de las plantas. (Gr. haploos, simple). er Diploide.

n alélica específica de cierto número de loci en un bloque e ligamiento definido.

tes alelos en uno o varios ci genéticos. (Gr. heteros, igual). Ver Homocigoto.

s Endogamia: El apareamiento de individuos genéticamente relacionados entre sí. El apareamiento entre parientes. El mejoramiento a través de una sucesid Enzima de restricción: Endonucleasac Equilibrio de Hardy-Weinberg: La distribución estable de frecuencias de genotipos, AA, Aa y aa, en las proporciones p², 2pq y q², respectivamente (donp y q son las frecuencias de los alelos, A y a), que es una consecuencia del apareamiento ad Erosión genética: Pérdida de la diversidad genética entre poblaciones de la misma especie y dentro de ellasb Filogenia: Historia evolutiva de una especie. Un diagrama que iluste Flujo génico: Intercambio de material genético entre poblaciones diferentes. Puede usarse en el sentido de la reproducción de plantas (es decir, debido a ladispersión de gametos y cigotos) o debido a la influencia del hombre, como lin Gen: Unidad básica, tanto física como funcional, de la herencia, que transmiinformación de una generación a la siguiente. Es un segmento de ADNincluye una sectr Genética de poblaciones: El estudio cuantitativo y la medida de las poblaciones en términos estadísticos; por ejemplo, el estudio de los fenómegenéticos en función de parámetros estadísticos estándar como cuadros d G Haploide: Una dotación sencilla de cromosomas (la mitad de la serie comde material genético) presente en cada óvulo y célula espermática de los animales y enV Haplotipo: Constituciód Heterocigoto: Un individuo diploide que tiene diferenlo

Page 202: Medidas de la Diversidad Genética

Homocigoto: Un individuo diploide que tiene alelos idénticos en uno o varios loci genéticos. (Gr. homos, mismo). Ver Heterocigoto. Isoenzima: Formas múltiples de una enzima cuya síntesis es controlada por más de un gen. Locus (pl. loci): Sitio específico de un cromosoma donde está localizado un gen o un trozo definido de ADN. Maleza: • En agricultura, una planta individual o especie que crece donde no se desea. • En ecología, una planta que se adapta para crecer en hábitats perturbados o

abiertos; por ejemplo, después de un incendio o de la alteración ocasionada por el hombre.

Marcador: Ubicación física identificable en un cromosoma cuya herencia puede rastrearse (por ejemplo, un gen, un sitio de corte de una enzima de restricción o un marcador de RFLP). Marcador genético: Un alelo, una banda en un gel o un carácter que sirve experimentalmente como sonda para identificar a un individuo o a alguna de sus características. Mejoramiento: La propagación y manipulación genética mediante la hibridación o la autogamia deliberada de plantas, para seleccionar progenie mejorada. Migración: El movimiento de individuos entre poblaciones que, en otras circunstancias, están reproductivamente aisladas. Mutación: Término para describir un cambio abrupto del fenotipo que se hereda. Cualquier alteración permanente y heredable en la secuencia de ADN. Los tipos de mutaciones incluyen mutaciones puntuales, deleciones, inserciones y alteraciones en el número y la estructura de los cromosomas. Pariente silvestre: Un pariente de una especie cultivada que crece en forma silvestre y no se utiliza para fines agrícolas. Pirimidina: Un compuesto básico nitrogenado, de un solo anillo, que está presente en los ácidos nucleicos. Las pirimidinas del ADN son citosina y timina. Las pirimidinas del ARN son citosina y uracilo. Población: En genética, es un grupo de individuos que comparten un acervo genético común y tienen el potencial para cruzarse entre sí. Polimorfismo: Aparición de diferentes formas asociadas con diversos alelos de un gen o con homólogos de un cromosoma. Polinización cruzada (Outbreeding): Un sistema de apareamiento alógamo en el cual el apareamiento se realiza entre individuos que están menos estrechamente relacionados que otros pares promedio de la población elegidos al azar. También llamado exogamia. Ver Endogamia.

Page 203: Medidas de la Diversidad Genética

Purina: Un compuesto básico nitrogenado, de dos anillos, que está presente en

APD: Polimorfismo del ADN amplificado al azar. Técnica que amplifica tramos

o s

a eorganización de su material genético y, de ese modo

crementa el potencial de la diversidad genética. También conocida como

Reg ticos): s,

• viabilidad de la accesión original. Por lo general, este proceso se realiza

exual: La formación de nuevos individuos a partir de la(s) élula(s) de un progenitor único; no implica la recombinación o la mezcla de

n de nuevos individuos al mezclar, en una nica célula, los genes de dos células diferentes, generalmente gametos y casi

ntre los individuos se detecta por las diferencias en los tamaños de los e restricción.

ero de sistema de apareamiento es de gran importancia para

eterminar tanto la estructura genética como el potencial evolutivo de las

producción: El sistema por el cual una especie se reproduce. En lantas, hay varios sistemas naturales; por ejemplo, ver también Alogamia y

SSR: Ver ADN microsatélite.

los ácidos nucleicos. Las purinas del ADN y del ARN son adenina y guanina. Ranónimos de ADN, empleando la PCR con cebadores arbitrarios. Recombinación: Es la producción de una molécula de ADN con segmentos derivados de más de una molécula de ADN de los progenitores. En los organismos eucariotas, este proceso se realiza mediante el intercambio recíprocde ADN entre cromátidas no hermanas de un par homólogo de cromosomadurante la profase de la primera división meiótica. La recombinación permitelos cromosomas la rinsobrecruzamiento.

eneración (de colecciones de recursos gené• El proceso de restaurar una planta completa a partir de células individuale

mediante la manipulación de un cultivo in vitro. El cultivo de una muestra de semillas de una accesión para renovar la

cuando la viabilidad del material original desciende a menos de 85%. Reproducción ascformas paternas. Reproducción sexual: La produccióúsiempre de diferentes progenitores. RFLP: Polimorfismo de longitud de los fragmentos de restricción. La variación efragmentos de ADN después de la digestión con una enzima d Simpátrico: Que se encuentra en la misma zona geográfica. Sistema de apareamiento: El patrón de apareamiento entre los individuos de una población, incluyendo factores tales como grado de endogamia y númparejas simultáneas. Eldpoblaciones naturales. Sistema de repEndogamia.

Page 204: Medidas de la Diversidad Genética

Formulario para sugerencias La materia de este módulo experimenta cambios continuos, lo que hace aconsejable su actualización periódica. Por esta razón, presentamos el módulo en formato electrónico. Para ayudarnos con nuestra tarea de actualización, agradeceríamos recibir comentarios y solicitudes de los usuarios para mejorarlo. También nos ayudarán mucho sus opiniones sobre la utilidad de esta herramienta. Hacemos enseguida unas cuantas preguntas orientadoras para que usted las responda. Puede enviar sus respuestas directamente pulsando el botón ‘Enviar’ al final de esta página, o puede enviarlas por telefax [No: (57-2) 445 0096], por correo postal a su contacto en el IPGRI, o por correo electrónico a alguna de estas direcciones: [email protected]; [email protected]; o [email protected] Preguntas:

1. Descríbanos la forma en que usa esta herramienta…

2. ¿Usted piensa que el módulo…: a. ...proporciona una síntesis global de los conceptos científicos

básicos relativos a la genética de poblaciones para evaluar la diversidad genética?

Sí No ¿Por qué?

b. …muestra cómo el uso de las tecnologias de marcadores moleculares ofrece un método adecuado para cualquier persona que planea hacer investigación sobre el análisis de la diversidad genética?

Sí No ¿Por qué?

c. ...proporciona información sobre cómo analizar e interpretar datos de marcadores moleculares?

Sí No

¿Por qué?

Page 205: Medidas de la Diversidad Genética

d. ...proporciona una lista de los recursos bibliográficos actuales para cada uno de los temas tratados?

Sí No

¿Por qué?

3. Díganos lo que le gustó y lo que usted cambiaría sobre los siguientes aspectos del módulo:

a. El contenido, en general

b. La estructura que tienen los submódulos

c. Los dibujos, los diagramas, las imágenes

d. Los apéndices e. Otros aspectos

4. De los siguientes temas, ¿cuál agregaría usted al módulo para hacerlo

más útil en relación con su situación particular?

a. Referencias básicas

b. Ejemplos de aplicaciones

c. Información adicional sobre: I. Conceptos de la genética de poblaciones II. Medidas de la diversidad genética III. Programas informáticos descritos

d. Otros:

5. ¿Qué otros temas querría usted ver en este módulo? 6. ¿Fue difícil descargar de Internet el módulo o alguna de sus partes?

¿Por qué?

Enviar M. Carmen de Vicente, IPGRI César López, Univ. La Molina Correo electrónico: [email protected] Correo electrónico: [email protected] Theresa Fulton, IGD, Cornell University Correo electrónico: [email protected]

Page 206: Medidas de la Diversidad Genética

Agradecimientos La publicación de Análisis de la Diversidad Genética Utilizando Datos de Marcadores Moleculares: Módulo de Aprendizaje es el resultado de un esfuerzo colaborativo entre el Instituto Internacional de Recursos Fitogenéticos (IPGRI) y el Instituto para la Diversidad Genómica (IGD) de Cornell University. Los autores agradecen especialmente la contribución recibida de las siguientes personas e instituciones que permitieron que esta publicación fuera una realidad: La Oficina Regional del IPGRI para Asia, el Pacífico y Oceanía, que desde su Proyecto de Árboles Frutales Tropicales, apoyado, a su vez, por el Banco Asiático de Desarrollo (ADB), financió en parte la preparación del material de este módulo.

Félix Alberto Guzmán (Oficina Regional del IPGRI-Américas), por su ayuda en simplificar cierta información suministrada y en adaptar la versión final con las correcciones recibidas por los diferentes colegas y el editor.

Amanda Garris (IGD) y Steve Tanksley (Departamento de Fitomejoramiento), ambos de Cornell University, por permitirnos usar información y cifras contenidas en sus diapositivas.

Joanne Labate, por las “discusiones virtuales” y Alexandra Casa y Martha Hamblin, del IGD, por la asesoría sobre los programas que deberíamos tratar.

Humberto Gómez Paniagua (Centro Internacional de Agricultura Tropical [CIAT], Colombia), por sus comentarios oportunos que permitieron mejorar el contenido y la presentación didáctica de este producto.

Myriam Cristina Duque (CIAT), por su ayuda en la preparación del esquema para este módulo y por aclarar conceptos sobre medidas de la diversidad genética. Marilyn Warburton (Centro de Biotecnología Aplicada, Centro Internacional para el Mejoramiento de Maíz y Trigo [CIMMYT], México) por sus sugerencias acerca de la manera de mejorar las diapositivas sobre métodos de agrupación.

El personal de la Unidad de Recursos Genéticos del CIAT (Colombia) por compartir la foto de frijol que se utiliza como fondo en uno de los submódulos.

Profesor Heiber Cárdenas (Departamento de Biología, Universidad del Valle, Cali, Colombia), por probar el módulo de aprendizaje con cinco de sus estudiantes (Iván Andrés González, María Fernanda Castillo, Carmenza Montoya, Fernando Rondón González y Diego Mauricio Villamarín Miranda) y por hacer comentarios invaluables para mejorarlo.

Luigi Guarino, Ramanatha Rao, Issiaka Zoungrana, Margarita Baena, Zongwen Zhang, Mikkel Grum, Jan Engels y Elisabeth Goldberg (de diferentes oficinas del IPGRI), por sus comentarios y sugerencias sobre la forma de mejorar este módulo de aprendizaje y hacerlo más útil para nuestros socios colaboradores.

Elizabeth L. McAdam, por su ayuda en editar el manuscrito en inglés y por sus valiosas sugerencias para mejor el formato de este producto, y Lynn Menéndez (CIAT) y María Patricia Cruz, por su ayuda en la traducción del manuscrito al español.

Gladys Rodríguez (CIAT), por su ayuda en la diagramación de este producto.

Page 207: Medidas de la Diversidad Genética

IPGRI - El Instituto Internacional de Recursos Fitogenéticos (IPGRI) es un organismo internacional autónomo de carácter científico que busca promover la conservación y el uso de los recursos fitogenéticos para beneficio actual y futuro de la humanidad. El IPGRI es uno de los 16 Centros Future Harvest auspiciados por el Grupo Consultivo sobre Investigación Agrícola Internacional (GCIAI), una asociación de entidades públicas y privadas que apoyan avances en la investigación conducentes a reducir el hambre y la pobreza, mejorar la nutrición humana y la salud, y proteger el ambiente. El Instituto tiene su sede en Maccarese, cerca de Roma, Italia, y oficinas en más de 20 países del mundo. El IPGRI opera mediante tres programas: (1) el Programa de Recursos Fitogenéticos, (2) el Programa de Apoyo a las Actividades en Recursos Fitogenéticos de los Centros del GCIAI y (3) la Red Internacional para el Mejoramiento del Banano y el Plátano (INIBAP). El carácter de organismo internacional del IPGRI lo confiere la firma del Convenio de Creación del Instituto, a enero de 2003 ratificado por los gobiernos de los siguientes países: Argelia, Australia, Bélgica, Benin, Bolivia, Brasil, Burkina Faso, Camerún, Congo, Costa de Marfil, Costa Rica, Chile, China, Chipre, Dinamarca, Ecuador, Egipto, Eslovaquia, Grecia, Guinea, Hungría, India, Indonesia, Irán, Israel, Italia, Jordania, Kenia, Malasia, Mauritania, Marruecos, Noruega, Pakistán, Panamá, Perú, Polonia, Portugal, la República Checa, Rumania, Rusia, Senegal, Sudán, Suiza, Siria, Túnez, Turquía, Ucrania y Uganda. Las actividades de investigación del IPGRI reciben apoyo financiero de más de 150 donantes, entre los que se incluyen gobiernos, fundaciones privadas y organismos internacionales. Detalles sobre los donantes y las actividades de investigación aparecen en los Informes Anuales del IPGRI, disponibles en forma impresa, a solicitud, en la dirección electrónica [email protected] o en las páginas del IPGRI en la Internet (www.ipgri.org). Las designaciones geográficas empleadas en esta publicación al igual que la presentación del material no expresan en modo alguno opinión del IPGRI o del GCIAI sobre el estatus legal de ningún país, territorio, ciudad o área, ni acerca de sus autoridades o de la delimitación de sus fronteras. Asimismo, las opiniones expresadas son las de los autores y no necesariamente reflejan los puntos de vista de estas organizaciones. La mención de alguna marca registrada se suministra con fines informativos únicamente, no de apoyo al producto. IGD - El Instituto para la Diversidad Genómica ( Institute for Genomic Diversity, IGD) se encuentra en la ciudad de Ithaca, Nueva York, Estados Unidos. La misión del IGD es desarrollar, transferir y proveer tecnologías y recursos educacionales, para resolver los problemas que afectan la conservación de la biodiversidad y la seguridad alimentaria global. Específicamente, nuestros objetivos son: utilizar estrategias de genómica comparativa y evolutiva para resolver problemas aplicados; desarrollar y transferir tecnologías capacitadoras en genómica y bioinformática; proveer apoyo a los esfuerzos nacionales e internacionales en conservación, agricultura y mejoramiento de cultivos; y educar y entrenar en todos los niveles (incluyendo pero no limitados a los estudiantes de pregrado y posgrado, científicos visitantes, profesores y personal en general). Derechos de Autor © 2004 por el Instituto Internacional de Recursos Fitogenéticos (IPGRI) y el Instituto para la Diversidad Genómica (IGD), Cornell University. Salvo lo declarado expresamente de otro modo, el IPGRI y Cornell University poseen los derechos de autor y todos los demás derechos relacionados con este trabajo. Los individuos pueden copiar e imprimir libremente los materiales para fines educativos o no comerciales, sin necesidad de obtener permiso previo de los propietarios de los derechos de autor. Sin embargo, es un requisito citar la fuente de los materiales. Cita de Vicente, M.C., López, C. y Fulton, T. (eds.). 2004. Análisis de la Diversidad Genética Utilizando Datos de Marcadores Moleculares: Módulo de Aprendizaje. Instituto Internacional de Recursos Fitogenéticos (IPGRI), Roma, Italia. Traducción de la versión inglesa, "Genetic Diversity Analysis with Molecular Marker Data: Learning Module", editada por M.C. de Vicente, C. López y T. Fulton. IPGRI y Cornell University. 2003. M. Carmen de Vicente, Ph.D., es Genetista Molecular de Plantas en la Oficina Regional del IPGRI- Américas, en Cali, Colombia. César López, MSc, es Catedrático de Genética en la Universidad Nacional Agraria La Molina, en Lima, Perú. Theresa Fulton, Ph.D., es Directora de Extensión en el Instituto para la Diversidad Genómica de Cornell University, Ithaca, NY.