Datos perdidos y su efecto en la resolución de la filogenia...

22
Datos perdidos y su efecto en la resolución de la filogenia Angélica Cogollo Calderón 2030178 INTRODUCCIÓN: El problema de los datos perdidos siempre ha sido considerado el mayor obstáculo en la reconstrucción de la filogenia. Estudios empíricos y teóricos muestran que incluir taxa incompletos puede generar múltiples árboles igualmente parsimoniosos, pobremente resueltos y con poca precisión filogenética (Wiens, 2003). Sin embargo, cuando los análisis de alto nivel sistemático muestran que determinado grupo presenta relaciones muy poco resueltas (a pesar de no haber datos pérdidos), es bueno evaluar como la resolución de la filogenia se ve afectada cuando se eliminan ciertos taxa, con el fin de determinar si éstos me producen ruido en la reconstrucción. En este trabajo, se utilizó la filogenia del género Manihot tomado del trabajo de Madriñán, et al, 2008 y se le aplicaron diferentes técnicas de análisis filogenético, con el fin de evaluar las relaciones presentes en este grupo. MATERIALES Y METODOS: Los códigos de acceso en Genbank para todas las secuencias se encontraron bajo los números: EU518894 a EU518926. Se trabajaron con cinco matrices modificadas, es decir, a cada una de las cuales se les removieron cierto número de taxa. (ver tabla 1). Estos datos moleculares se evaluaron con el criterio de parsimonia en el programa Winclada 1.00.08 (Nixon, 1999), hallando el soporte de Boopstrap. A los arboles mas parsimoniosos resultantes se les hizo consenso estricto. Se determinó el set de costos óptimo, utilizando el programa POY ver. 4.0.2398 beta (Weelher et al, 2007). Las secuencias nucleotídicas fueron alineadas con Muscle ver. 3.6 (Edgar, 2005). Se determinaron los modelos evolutivos para cada gen por medio del programa R ver. 2.8.1 y se hizo un análisis bajo el criterio likelihood de cada gen en phyml30. El análisis filogenético bayesiano fue realizado usando el programa MrBayes 3.1 (Huelsenbeck & Ronquist, 2001) y finalmente se realizó un árbol consenso de la mayoría sólo con aquellos árboles representados en la zona estable de la curva. RESULTADOS Y ANÁLISIS Para la búsqueda heurística bajo el criterio de parsimonia se obtuvo por consenso estricto árboles con longitudes entre 70 y 73, Índices de Consistencia entre 91 y 95 e

Transcript of Datos perdidos y su efecto en la resolución de la filogenia...

Page 1: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Datos perdidos y su efecto en la resolución de la filogenia Angélica Cogollo Calderón 2030178

INTRODUCCIÓN: El problema de los datos perdidos siempre ha sido considerado el

mayor obstáculo en la reconstrucción de la filogenia. Estudios empíricos y teóricos

muestran que incluir taxa incompletos puede generar múltiples árboles igualmente

parsimoniosos, pobremente resueltos y con poca precisión filogenética (Wiens, 2003).

Sin embargo, cuando los análisis de alto nivel sistemático muestran que determinado

grupo presenta relaciones muy poco resueltas (a pesar de no haber datos pérdidos), es

bueno evaluar como la resolución de la filogenia se ve afectada cuando se eliminan

ciertos taxa, con el fin de determinar si éstos me producen ruido en la reconstrucción.

En este trabajo, se utilizó la filogenia del género Manihot tomado del trabajo de

Madriñán, et al, 2008 y se le aplicaron diferentes técnicas de análisis filogenético, con

el fin de evaluar las relaciones presentes en este grupo.

MATERIALES Y METODOS: Los códigos de acceso en Genbank para todas las

secuencias se encontraron bajo los números: EU518894 a EU518926. Se trabajaron con

cinco matrices modificadas, es decir, a cada una de las cuales se les removieron cierto

número de taxa. (ver tabla 1). Estos datos moleculares se evaluaron con el criterio de

parsimonia en el programa Winclada 1.00.08 (Nixon, 1999), hallando el soporte de

Boopstrap. A los arboles mas parsimoniosos resultantes se les hizo consenso estricto. Se

determinó el set de costos óptimo, utilizando el programa POY ver. 4.0.2398 beta

(Weelher et al, 2007). Las secuencias nucleotídicas fueron alineadas con Muscle ver.

3.6 (Edgar, 2005). Se determinaron los modelos evolutivos para cada gen por medio del

programa R ver. 2.8.1 y se hizo un análisis bajo el criterio likelihood de cada gen en

phyml30. El análisis filogenético bayesiano fue realizado usando el programa MrBayes

3.1 (Huelsenbeck & Ronquist, 2001) y finalmente se realizó un árbol consenso de la

mayoría sólo con aquellos árboles representados en la zona estable de la curva.

RESULTADOS Y ANÁLISIS

Para la búsqueda heurística bajo el criterio de parsimonia se obtuvo por consenso

estricto árboles con longitudes entre 70 y 73, Índices de Consistencia entre 91 y 95 e

Page 2: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Índices de Retención entre 90 y 94. . El mejor costo en el análisis de sensibilidad para

todas las matrices se observa en la tabla 2.

En los diferentes análisis, tanto de parsimonia, (figura 1 – 10), likelihood (figuras 11 –

15) y bayes ( 16 -20) se obsevó que se mantiene la relación entre ( M. aesculifoia, M.

rubricaulis) y (M. orbicularis, M. sparsifolia). Algunos árboles muestran clados

totalmente resueltos, pero estos varían de manera constante en todas las topologías, se

recalca que la politomía formada por (M. alutacea, M. longipetiolata, M.

cecropiaefolia), se resuelve mostrándose una nueva relación consistente en todos los

análisis entre (M. alutaceae, M. irwinii).

El modelo de evolución elegido para este gen fue JC69 +I+G , este se utilizó para la

construcción de la filogenia para cada gen con el criterio likelihood e inferencia

bayesiana.

Conclusiones:

Los resultados sugieren que al remover diferentes taxa de la topología, es decir, una

especie de Jacknife taxonómico, las politomias existentes se me resuelven un poco,

como en el caso de (M. alutacea, M. longipetiolata, M. cecropiaefolia) pero esta

resolución es muy variable ya que todos los análisis me muestran diferentes patrones

de agrupamiento, con esto no se podría dilucidar las relaciones existentes en este grupo,

ni determinar si hay un taxa conflictivo, puesto que los resultados son muy inconstantes.

Lo que quería observar en este estudio, era si al remover estos taxa que me causaban

ruido en la filogenia, y analizarlos cada uno por separado, me podrían esclarecer un

poco más las relaciones, pero por lo observado en los resultados, no fue así. Si bien es

sabido, que los datos faltantes siempre van a incurrir en filogenias poco resueltas y de

baja confiabilidad, quizás utilizando diferentes parámetros, como numero de iteraciones,

estrategias de búsquedas, grandes set de datos, datos combinados y análisis más

exhaustivos me puedan ayudar a dar solución al problema que siempre ha existido en

las reconstrucciones filogenéticas cuando faltan datos, como en el caso de los fósiles

donde aún continua el debate.

Ya por último, las relaciones dentro del género Manihot, aún no están esclarecidas, y

aunque este estudio se hizo a nivel molecular, cabe resaltar que a nivel morfólogico

también se siguen presentando incongruencias, puesto que la familia Euphorbiaceae es

muy polimórfica.

Page 3: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Bibliografía:

Edgar, Robert C. 2004. MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32(5), 1792-97 Goloboff, p. a., 1998 : nona v.2.0, program and documentation. Huelsenbeck JP & F Ronquist. 2001. MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics 17:754-755. Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns in the genus Manihot (Euphorbiaceae) inferred from analyses of nuclear and chloroplast DNA regions. Molecular Phylogenetics and Evolution 49 (2008) 260–267 Stephane Guindon and Olivier Gascuel conceived the original PhyML algorithm. Wiens, J. Missing Data, Incomplete Taxa, and Phylogenetic Syst. Biol. 52(4):528-538, 2003 Copyright (?) Society of Systematic Biologists ISSN: 1063-5157 print / 1076-836X online DOI: 10.1080/10635150390218330

Wheeler, W.; Gladstein, O., 1996. POY V.3.0. Program and documentation, available at. ftp://ftp. Amnb.org/pub/molecular/poy. Tabla 1

Matrices:

Manihot. Filogenia original

Manihot 1 Se removieron las sp: M. alutaceae, M. cecropiafelia, M. orbicularis, M. sparsifolia

Manihot 2 Se removieron las sp: M. pilosa, M. esculenta subsp. peruviana, M. pseudoglaziovii, M. peltata, M. esculenta subsp. Esculenta, M. irwinii

Mainhot 3

Se removieron las sp: M. caerulescens, M. jacobinensis, M. violaceae, M. filamentosa, M. guaranitica.

Manihot 4 Se removieron las sp: M. aesculifolia, M. rubricaulis, M.tristis, M. escuelenta subsp. Flabellifolia, M. purpureocostata

Tabla 2 Costos en Poy

Ts2tv4g5 Ts2tv5g1 Ts2tv6g2 Ts3tv5g2 Ts2tv1g2 Manihot 2961 1003 1154 1181 940 Manihot1 2589 820 1100 1124 1064 Manihot2 2554 1047 1090 1117 1054 Manihot3 2265 1032 1134 1164 1098 Manihot4 1402 332 620 644 585

Page 4: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

PARSIMONIA Y BOOTSTRAP

Figura 1. Parsimonia Manihot

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 5: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 2. Boostrap Manihot

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 6: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 3Manihot 1

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 7: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 4 Manihot 1

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 8: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 5 Manihot 2

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 9: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 6 Manihot 2

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 10: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 7. Manihot 3

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 11: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 8 Manihot 3

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 12: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 9. Manihot 4

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 13: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 10. Manihot 4

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 14: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

LIKELIHOOD

Figura 11. Manihot

Figura 12. Manihot 1

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 15: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 13. Manihot 2

Figura 14. Manihot 3

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 16: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 14. Manihot 4

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 17: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

BAYES

Figura 16. Manihot

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 18: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 17. Manihot 1

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 19: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 18. Manihot 2

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 20: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 19. Manihot 3

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 21: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Figura 20. Manihot 4

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!

Page 22: Datos perdidos y su efecto en la resolución de la filogenia ...tux.uis.edu.co/labsist/docencia/finales/final2008/...Madriñán, S., Debouck , D, Rodriguez . (2008) Phylogenetic patterns

Filogenia molecular de Manihot (Madriñán et al , 2008)

Created by eDocPrinter PDF Pro!!

Buy Now to Create PDF without Trial Watermark!!