Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas...

55
Herramientas - Nancy I. L ópez 2011 Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas A. CONSTRUCCIÓN DE ÁRBOLES FILOGENÉTICOS A. CONSTRUCCIÓN DE ÁRBOLES FILOGENÉTICOS

Transcript of Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas...

Page 1: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Curso Teórico-Práctico de Posgrado  

  Herramientas informáticas

para el análisis estructural de ácidos nucleicos y

proteínas

A. CONSTRUCCIÓN DE ÁRBOLES FILOGENÉTICOSA. CONSTRUCCIÓN DE ÁRBOLES FILOGENÉTICOS

Page 2: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

 

Árbol filogenético 1° alineamiento múltiple. Árbol obtenido dependiente de este alineamiento.

Construcción de árboles filogenéticos

Filogenia es la ciencia de estimar el pasado evolutivo. Filogenia molecular basada en comparación de secuencias

¿Qué es un árbol? Modelo/ estructura matemática que se usa para modelar la historia evolutiva de un grupo de secuencias o de organismos.

Page 3: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

FILOGENIA MOLECULARFILOGENIA MOLECULAR Es el estudio de relaciones evolutivas entre organismos o genes por una

combinación de biología molecular y técnicas estadísticas.

Si se estudian relaciones entre organismos con fines de clasificación también se denomina sistemática molecular.

HistoriaHistoria

Uso de datos moleculares en filogenia comenzó en los ´60 secuenciación de proteínas: relaciones entre ordenes de mamíferosotras técnicas moleculares tales como hibridización DNA-DNA .

Técnicas de DNA recombinante ´70s : rápida acumulación de datos de secuencias de DNA.

’85 PCR

Page 4: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

¿Cómo puede medirse el cambio evolutivo?

Distancia evolutiva entre 2 especies medida por diferencias en la secuencias de nucleótidos o aa de macromoléculas homólogas.

Las secuencias de DNA, RNA y proteínas han cambiado muy lentamente durante la evolución.

Diferentes moléculas: diferentes velocidades de evolución. Muchas secuencias son mosaicos de diferentes velocidades evolutivas.

RNA: diferentes regiones estructurales evolucionan a diferentes velocidadesProteinas: Cambios silenciosos (x ej. posición 3 de codones). Carácter degenerado del código genético.

Page 5: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

¿Qué secuencias deberíamos utilizar?

Elección de la secuencia:

¿evolución rápida o lenta?

¿relaciones cercanas o distantes?

Page 6: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Elección de la molécula correcta

. Distribución universal

. Funcionalmente homóloga

. Alineamiento de secuencias debe permitir determinar regiones de homología y regiones de heterogeneidad

. Secuencia elegida debería variar en forma proporcional con la distancia evolutiva a medir

. No debe estar sujeta a transferencia entre organismos filogenéticamente distantes (transferencia lateral)

. La cantidad de información debe ser suficiente para que

el análisis sea estadísticamente significativo.

Page 7: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Debido a la antigüedad del proceso de síntesis de proteínas, el RNA es una excelente molécula para discernir relaciones evolutivas entre organismos vivientes

.Tiene distribución universal y cumple una misma función. Cambia muy lentamente . Posee regiones altamente conservadas en todos los organismos y regiones con mayor variabilidad. Permite comparaciones entre organismos muy relacionados o poco relacionados

Elección de la mejor molécula para estimar el tiempo evolutivo

RNA mejor cRNA mejor cronómetro o reloj molecularronómetro o reloj molecular

Page 8: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

3 tipos de moléculas RNA: 5S, 16S y 23S.

Subunidad pequeña (30S): 16SSubunidad mayor (50S): 5S, y 23S16S 1500 nucleótidos 18S eucariotas 1874

nucleótidos

Regiones + conservadas y regiones variables. Más conservadas para comparar los más distantes y más variables para los más cercanos.

Regiones únicas secuencia firma (signature) usadas para diseñar sondas.

Ribosomas:Presentes en todos los organismos (procariotas, plantas, animales).

Características en procariotas

•Técnicas de secuenciación desarrolladas y mejoradas para facilitar el análisis. Gen 16S rRNA: 2 cadenas confirman la secuencia (PCR simple).

Otras moléculas Citocromo c y ribulosa 1,5 bisfosfato carboxilasa (Rubisco). No universales.

Page 9: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Alineamiento de una región altamente conservada del 16S/18S rRNA

Homo sapiens ...GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGCTGCAGTTAAAAAG...S. cereviceae ...GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAG...Zea maize ...GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTTAAGTTGTTGCAGTTAAAAAG... Escherichia coli ...GTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCG...Anacystis nidulans ...GTGCCAGCAGCCGCGGTAATACGGGAGAGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCG...Thermotoga maritima ...GTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTACCCGGATTTACTGGGCGTAAAGGG... Methanococcus vannielii ...GTGCCAGCAGCCGCGGTAATACCGACGGCCCGAGTGGTAGCCACTCTTATTGGGCCTAAAGCG... Thermococcus celer ...GTGGCAGCCGCCGCGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCG... Sulfolobus sulfotaricus ...GTGTCAGCCGCCGCGGTAATACCAGCTCCGCGAGTGGTCGGGGTGATTACTGGGCCTAAAGCG...

Eucariotas

Procariotas

Mólecula del 16S rDNA en procariotas tiene su equivalente en 18S rDNA de eucariotas

Page 10: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Regiones conservadas y variables en la molécula del 16S rRNA

Estructura tridimensional complejaque interactúa con proteínas y otros RNAs.

E. coli 1.542 pb

Cambios en esta maquinaria son contra seleccionados. Modificaciones que han ocurrido en billones de años de evolución son usados para construir árboles filogenéticos.

Page 11: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

1977 Carl Woese Filogenia universal. Sus investigaciones sentaron las bases de la filogenia molecular de procariotas utilizando el 16S rDNA.Sustento experimental

“Revolución de Woese”

Woese y Fox. 1977. Phylogenetic structure of the prokaryotic domain: the primary kingdoms. PNAS 74:5088-5090.

RNA ribosomal 16S/18S

Page 12: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Otras aplicaciones del 16S rRNA•Exploración de diversidad de procariotas no cultivables.

Nuevos phyla descubiertos por análisis molecular de hábitats naturales

Arbol filogenético basado en secuencias del gen del 16S rRNA de Bacteria, basado en cultivos puros y bibliotecas genómicas de muestras naturales.

(Hugenholz, P, Goebel BM and Pace, NR. 1998. J. Bacteriol. 180:4765-4774).

Page 13: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Células de E. coli, Bordetella y Legionella. Hibridización con sonda para bacterias (Eub338-verde) y con sonda específica para Legionella micdadei (amarillo). FlSH (Fluorescent in situ hybridization)

•Identificación: diseño de sondas marcadas a partir de las secuencias “firma” del 16S rRNA

. Monitoreo de comunidades microbianas por técnicas independientes del cultivo.

. Detección de patógenos en una comunidad.

Otras aplicaciones del 16S rRNA

Page 14: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Ribosomal Database Project Michigan State University (http://rdp.cme.msu.edu/)RDP Release 10, Update 18 :: Jan 25, 2010 :: 1,358,426  16S rRNAs RDP Release 10, Update 3 :: September 4, 2008 :: 677,057  16S rRNAs Septiembre 2006 (Release 9.42), 262.030 secuencias 84.442 bacterias cultivadas177.588 de muestras ambientales101.877 casi largo total (1200 bases) 5.543 secuencias de especies tipo (type strains). Importantes por su valor taxonómico y filogenético.

Bases de datosBases de datos de Nucleótidos:

.GenBank: International Collaboration

NCBI (USA), EMBL (Europe), DDBJ (Japan and Asia) Herramientas BLAST

Page 15: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Page 16: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Page 17: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

ERA GENÓMICA Filogenómica

Page 18: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Análisis filogenético clásico: Darwin (Origin of species, November 24, 1859) propiedades morfológicas y fisiológicas (ej.: sangre fría y sangre caliente, escamas, dientes, alas, etc.)Métodos basados datos moleculares: secuencias homólogas en diferentes especies (DNA o proteinas)

Árboles ¿en qué se basan?

La filogenia molecular permite La filogenia molecular permite obtener árboles basados obtener árboles basados en genes o secuencias y estos en genes o secuencias y estos pueden ser adecuados como pueden ser adecuados como árboles para organismosárboles para organismos..

Page 19: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Datos moleculares (en particular secuencias de DNA) son más “potentes” que los datos morfológicos y fisiológicos

.- Proteínas y de DNA evolución + regular

.- Ofrecen amplias posibilidades de tratamientos cuantitativos.

.- Son más abundantes.

Moléculas como testimonio de la historia Moléculas como testimonio de la historia evolutivaevolutiva

Page 20: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Construcción de árboles filogenéticos

1. Definir conjunto de secuencias a analizar (DNA, RNA o proteínas) provenientes de distintos organismos

2. Alinear correctamente esas secuencias

3. Aplicar métodos adecuados para la construcción de árboles filogenéticos

4. Evaluar estadísticamente el árbol filogenético obtenido

Page 21: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

. se pueden graficar de cualquier manera

. complejidad rotación (todas las ramas pueden rotar alrededor del plano de sus

nodos árboles =). crecen de izquierda a derecha . etiquetas son horizontales.

ÁrbolesÁrboles

OTU

Page 22: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Árboles con y sin raíz

Definir outgroup:. Miembro no natural del grupo de interés.. punto medio

Patrón de ramificación: topología

Raíz: nodo del cual los otros descienden.

Da dirección

Page 23: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Nr=(2n-3)!/[2n-2*(n-2)!], n ≥2Nu=(2n-5)!/[2n-3*(n-3)!], n ≥3

Nr para n = Nu para n+1Nr para n = Nu para n+1

Number of sequences

Number of unrooted trees

Number of rooted trees

3 1 34 3 155 15 1056 105 9457 945 103958 10395 1351359 135135 2027025

10 2027025 34459425

Page 24: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Esquema árbol

OTUs son:OTUs son:

.- Monofiléticos. Ej.: B y C..- Monofiléticos. Ej.: B y C.

.- Polifiléticos. Ej.: D y C..- Polifiléticos. Ej.: D y C.

Page 25: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Cladograma: es el modelo básico y simplemente muestra la distancia al antecesor común en términos relativos. Las ramas son de igual longitud por lo cual no indican el tiempo evolutivo. Filograma: contiene información adicional dada por la longitud de las ramas. Los números asociados con cada rama corresponden a un atributo de las secuencias, tal como cantidad de cambio evolutivo. Es aditivo. Métricos.Ultramétricos: tipo especial de árbol aditivo en el cual los extremos del árbol son equidistantes de la raíz y son proporcionales al tiempo de divergencia. Ultramétricos. 

Dendrograma: Término general

Page 26: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

1) Todas las distancias son positivas. 2) Una distancia entre 2 puede ser cero

si los 2 puntos son iguales: d(x,y)=0 si x=y.

3) Distancias son simétricas d(x,y)= d(y,x).

4) d (x,y)< d(x,z)+d(z,y).

Arboles ultramétricos Siguen estas reglas (son aditivos) y :* d(x,y)≤máx {d(x,z),d(z,y)}. Define

triángulo isósceles

ÁRBOLES ADITIVOS

Page 27: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Secuenciasalineadas

Algoritmo

Árbol filogenético

Algoritmos: Métodos de Distancia: UPGMA (Unweighted Pair Group Method with Arithmetic Mean), Vecino más cercano (Neighbor Joining)

Métodos basados en el carácter (secuencia): Máxima parsimonia (Maximum Parsimony), Máxima verosimilitud (Maximum Likelihood).

Page 28: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Métodos para la construcción de árboles filogenéticosMétodos de distanciaMétodos de distancia

Utilizan matrices de distancia

UPGMA: (Unweighted Pair Group Method with Arithmetic Mean)Agrupamiento pareado no ponderado utilizando media aritmética. Es el método más simple. Asume la existencia de un reloj molecular evolutivo.

NJ-Neighbour Joining. Vecino más cercano

Minimum evolution. Utiliza el método de cuadrados mínimos.

Métodos discretosMétodos discretosOperan directamente con las secuenciasOperan directamente con las secuencias

Parsimonia: usa un carácter. Criterio: buscar el menor número de cambios evolutivos requeridos Las hipótesis más sencillas son más probables que las más complicadas.

Máxima verosimilitud (Maximum likelihood): utiliza el estado del carácter y la distancia. Encuentra el árbol que con mayor probabilidad haya dado origen a los datos observados.

Page 29: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Sitios

1 2 3 4 5 6 7 1 T T A T T A A

2 A A T T T A A3 A A A A A T A 4 A A A A A A T

Distancias  1 0

2 3 03 5 4 0

4 5 4 2 0___________ 1 2 3 4

Matriz de distanciasS

ecu

enci

as

Diferencia o divergencia entre las secuencias

.- Rápidos

.- información restringida al árbol

Page 30: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Métodos discretos

Analizan cada columna dentro del alineamiento y construyen el mejor árbol que se ajusta a esa codición

.- lentos

.- ricos en información. Hipótesis para cada columna dentro del alineamiento. Puede obtenerse información sobre evolución de sitios específicos en la molécula (Ej.: sitios catalíticos o regiones regulatorias).

Page 31: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Máxima parsimonia

Utiliza más información que los métodos de distanciaNo requiere un modelo de evoluciónSe justifica con argumentos filosóficos más que estadísticos

Page 32: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

¿Cómo comparar diferentes métodos de construcción de árboles?

Eficiencia : rapidez“potencia”: número de datos requeridos para obtener resultados razonables Consistencia Robustez: sensibilidad a desviaciones Información sobre si los supuestos son violados.

METODO IDEAL DEBERIA CUMPLIR LOS 5 METODO IDEAL DEBERIA CUMPLIR LOS 5 CRITERIOS PERO NO EXISTECRITERIOS PERO NO EXISTE

Probar árboles con más de un método

Page 33: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Comparación de métodos para la construcción de árboles filogenéticos

Tener en cuenta los supuestos de cada método.El funcionamiento de un método es testeado por modelos de simulación con computadora y por pruebas empíricas.Ej.: . Modelos simples por ej. Subunidad pequeña del rRNA para comparar eucariotas.. Bacteriofago T7 manipulado en lab. a través de muchas generaciones analizando la tasa de mutación.Pocos métodos son explícitos acerca del patrón y la tasa de sustitución de nucleótidos.

Page 34: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

4. Evaluación estadística del árbol filogenético obtenido

El test más simple para probar si el conjunto de datos “soportan” el árbol obtenido es el del bootstrap.

Es un método estadístico que puede estimar las distribuciones por creación repetida y análisis de conjuntos de datos artificiales.Medir el error de muestreo: tomar muchas muestras de

la población estudiada y compararlas. Bootstrap simula esto pero en lugar de muestrear de una población “remuestrea” los datos originando pseudorréplicas.

Page 35: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Valores de bootstrap ( %). > 50 %.

Puede aplicarse a todos los métodos

Page 36: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Purinas

Pirimidinas

Transiciones

Page 37: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Programas

ClustalW AlineamientoGraficar con Treeview, Phylodraw

NJ-PlotPHYLIPMEGA 3.1 Es el más fácil de manejar

(Molecular Evolutionary Genetics Analysis)PAUP* (POP STAR). Es el más sofisticado y versátil

Page 38: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

TRABAJO PRÁCTICO -TP6.A

 Secuencias simples

 Alineamiento múltiple. Analizar. Observar árbol guía.

ClustalW para construir el árbol. Modificar opciones en la ventana “Phylogenetic tree”. Método utilizado por el programa es el del NJ-Vecino más cercano (Neighbour Joining). Elegir entre los posibles formatos de árbol (Neighbour, Phylip, Distance)

Con el archivo obtenido del CLustalW entrar en el programa Treeview y graficar el árbol.

Page 39: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

TREEVIEW

Page 40: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Programa MEGA 3.1Tutorial

0. Armar archivo. Alineamiento múltiple.

Page 41: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Alineamiento

Page 42: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Page 43: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Construir el árbol con bootstrap. Probar distintos métodos

Page 44: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

B. Comparación de los árboles filogenéticos obtenidos para microorganismos construidos en base a la secuencia de proteínas  y  a secuencias del 16S rRNA

Page 45: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Duplicación de genes, transferencia lateral entre otros Duplicación de genes, transferencia lateral entre otros procesos puede producir discrepancias entre filogenias procesos puede producir discrepancias entre filogenias basadas en genes y las referidas a organismos.basadas en genes y las referidas a organismos.

Transferencia lateral es uno de los mecanismos que crea Transferencia lateral es uno de los mecanismos que crea confusión en la interpretación de árboles filogenéticosconfusión en la interpretación de árboles filogenéticos

Bacterias pueden adquirir material genético de otros organismos a través de diversos mecanismos por un fenómeno denominado transferencia horizontal o lateral.

Rápidos cambios en la estructura poblacional en cortos períodos de t. Ej.: resistencia a antibióticos.

Especiación: Proceso por el cual los organismos evolucionan: determinado por transferencia vertical o herencia

Genotipo parental pasa a la progenie.

TRANSFERENCIA HORIZONTAL

Page 46: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Árboles basados en distintas moléculas

Diferentes moléculas pueden obtenerse árboles MUY diferentes a partir de los mismos organismos

Requisito que debe cumplir un marcador no ser objeto de transferencia horizontal.

Page 47: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Rojo: genes adquiridos por transferencia horizontal

Transferencia horizontal

Discrepancia en datos de rRNA?Existe cierta evidencia que los genes ribosomales sufren transferencia lateral y recombinación genética.

Page 48: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Kirsten M. Müllera2, Darlene W. Ellenora, Alison R. Sherwoodb, Robert G. Sheathc, Jamie J. Cannoned and Robin R. Gutelld

EVIDENCE FOR LATERAL TRANSFER OF AN IE INTRON BETWEEN FUNGAL AND RED ALGAL SMALL SUBUNIT rRNA GENES1

Journal of PhycologyVolume 41 Issue 2 Page 380  - April 2005

Microbiology (2000), 146, 2845-2854 Comparative sequence analyses reveal frequent occurrence of short segments containing an abnormally high number of non-random base variations in bacterial rRNA genes Yue Wang1 and Zhenshui Zhang1 Microbial Collection and Screening Laboratory, Institute of Molecular and Cell Biology, 30 Medical Drive, Singapore 1176091

J Bacteriol. 2003 December; 185(24): 7241–7246.

Horizontal Transfer of Segments of the 16S rRNA Genes between Species of the Streptococcus anginosus GroupLeo M. Schouls,1* Corrie S. Schot,1 and Jan A. Jacobs2Laboratory for Vaccine-Preventable Diseases, National Institute of Public Health and the Environment, Bilthoven,1 Department of Medical Microbiology, University Hospital of Maastricht, Maastricht, The Netherlands2

May 2003

Page 49: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Movimiento de material genético por mecanismos distintos a la reproducción o transferencia vertical.

Mecanismos:

TransformaciónConjugaciónTransducción

Agentes:

Virus Plásmidos

Elementos genéticos móviles Secuencias de inserción- transposones

Islas bacterianas

TRANSFERENCIA HORIZONTAL DE INFORMACIÓN GENÉTICA EN BACTERIAS

Page 50: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Transferencia horizontal puede ser inferida

Construcción de árboles filogenéticos del gen o proteína de interés vs. 16S rRNA

Análisis del contenido de G+C del gen vs. el resto del genoma

Uso de codones

Page 51: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

TRABAJO PRÁCTICO

A. Construcción de un árbol filogenético

B. Comparación de los árboles filogenéticos obtenidos a partir de secuencias de proteínas y de secuencias del gen del 16S rRNA

Page 52: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Construcción de árboles filogenéticos

1. Definir conjunto de secuencias a analizar (DNA, RNA o proteínas) provenientes de distintos microorganismos

2. Alinear correctamente esas secuencias

3. Aplicar métodos adecuados para la construcción de árboles filogenéticos

4. Evaluar estadísticamente el árbol filogenético obtenido

Page 53: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

1. Secuencias de la 1,2 y de la 2,3 catecol dioxigenasa. Armar archivo.

2. Buscar las secuencias correpondientes al gen del 16 S rRNA de las especies que poseen la enzima.

3. Realizar los árboles filogenéticos. Probar con más de un método

4. Comparar los árboles obtenidos.

TP6 parte B

Page 54: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Catecol dioxigenasas(1,2 CDO-2,3 CDO) Catechol 1,2 dioxygenase Catechol 2,3 dioxygenase

Page 55: Herramientas - Nancy I. López 2011 Curso Teórico-Práctico de Posgrado Herramientas informáticas para el análisis estructural de ácidos nucleicos y proteínas.

Herramientas - Nancy I. López 2011

Gram –/ProteobacteriasAlfa-ProteobacteriasBradyrhizobium japonicum 1,2 CDOBradyrhizobium sp. 1,2 CDORhizobium etli 1,2 CDORhizobium sp. ZJF08 2,3 CDO

ß-ProteobacteriaBurkholderia sp. TH2 1,2 CDOBurkholderia sp. 383Burkholderia sp. RP007 2,3 CDOAlcaligenes sp. 2,3 CDORalstonia eutropha/Cupriavidus necator H16 2,3 CDOAchromobacter sp. 2,3 CDORalstonia eutropha JMP134 1,2 CDODelftia tsuruhatensis 2,3 CDO

Gama-ProteobacteriasPseudomonas stutzeri 2,3 CDOPseudomonas mendocina 2,3 CDOPseudomonas aeruginosa 2,3 CDOAzotobacter vinelandii 2,3 CDOPseudomonas putida KT2440 1,2 CDOPseudomonas aeruginosa PAO1 1,2 CDOPseudomonas fluorescens PfO-1 1,2 CDOMarinobacter algicola 2,3 CDOAcinetobacter 1,2 CDO

Gram +Rhodococcus sp. RHA1 1,2 CDORhodococcus sp. RHA1 1,2 CDORhodococcus opacus 1,2 CDOArthrobacter sp. BA-5-17 2,3 CDOGeobacillus thermoglucosidasius 2,3 CDO

Catecol dioxigenasas(1,2 CDO-2,3 CDO) Catechol 1,2 dioxygenase Catechol 2,3 dioxygenase