WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

26
WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN

Transcript of WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Page 1: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

WAGNERLINNEO

MÉTODOS DE BÚSQUEDA DE

ARBOLES Y OPTIMIZACIÓN

Page 2: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Optimización de CaracteresOptimización de Caracteres

*

paralelismo 2 orígenes independientes 0 => 1 (DELTRAN)

origenyreversión(ACCTRAN)

0 0 1 1 0

A B C D E

*

0 => 1

==

1 => 0

Page 3: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda de arboles óptimosBúsqueda de arboles óptimos: : Soluciones exactasSoluciones exactas

Soluciones exactas solo pueden ser Soluciones exactas solo pueden ser usadas para un pequeño número de usadas para un pequeño número de taxa.taxa.

Búsqueda exhaustiva examina todos Búsqueda exhaustiva examina todos los arboles posibles. los arboles posibles.

Típicamente usados para grupos Típicamente usados para grupos problemas menores a 10 OTUsproblemas menores a 10 OTUs..

Page 4: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda exhaustivaBúsqueda exhaustiva

A

B C

1

2a

Arbol de partida, 3 taxa

A

B D

C

A

BD C

A

B C

D2b 2c

E

E

EE

E

Añada un cuarto taxón (D) en cada una de los tres combinaciones posibles -> tres árboles

Añada un quinto taxon (E) en cada una de las cinco posibles posiciones en cada uno de los tres arboles -> 15 arboles……….

Page 5: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Hay tres posibles arboles no enraizados Hay tres posibles arboles no enraizados para cuatro taxa (para cuatro taxa (AA, , BB, , CC, , DD))

A C

B D

Arbol 1

A B

C D

Arbol 2

A B

D C

Arbol 3

Inferencia Filogenética:

Búsqueda del “arbol verdadero o único”

Computacionalmente intensivo ( “hard problem”)

Page 6: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Número de árboles incrementa de manera exponencial con el numero de taxa

(2N - 5)!! = # arboles no enraizados para N taxa

CA

B D

A B

C

A D

B E

C

A D

B E

C

F

Page 7: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda de arboles óptimos: Búsqueda de arboles óptimos: Soluciones exactasSoluciones exactas

Branch and bound Branch and bound ahorra tiempo ahorra tiempo descartando familias de arboles durante la descartando familias de arboles durante la construcción del arbol. Elimina aquellos construcción del arbol. Elimina aquellos combinaciones que involucran un mayor combinaciones que involucran un mayor numero de pasos.numero de pasos.

Típicamente usado en problemas que Típicamente usado en problemas que involucran menos de 18 taxainvolucran menos de 18 taxa..

Page 8: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

A

B C

B1

A

B D

C

A

B C

D

B3

A1

A

B E

D

CC1.1

A

B D

E

CC1.3

A

B D

C

EC1.2

A

B

CC1.4

E D

A

B C

C1.5

ED

A

BD C

B2

C2.1

C2.2

C2.3

C2.4

C2.5

C3.1

C3.2

C3.3

C3.4

C3.5

Búsqueda de arboles óptimos: Soluciones Búsqueda de arboles óptimos: Soluciones exactas: Branch and Bound exactas: Branch and Bound

E

E

E

EE

Page 9: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda de arboles óptimos: Búsqueda de arboles óptimos: Búsqueda heurísticaBúsqueda heurística

Métodos heurísticos son usados para buscar en el Métodos heurísticos son usados para buscar en el espacio de arboles aquél más parsimonioso espacio de arboles aquél más parsimonioso seleccionando un árbol inicial e intercambiando ramas seleccionando un árbol inicial e intercambiando ramas buscando las mejores combinaciones. buscando las mejores combinaciones.

Problema: “No garantiza encontrar el más Problema: “No garantiza encontrar el más parsimonioso” (“se hace lo que se puede").parsimonioso” (“se hace lo que se puede").

Page 10: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda de arboles óptimos: Búsqueda Búsqueda de arboles óptimos: Búsqueda heurísticaheurística

Stepwise additionStepwise addition AsisAsis – – El orden en la matriz de datosEl orden en la matriz de datos.. ClosestClosest – –Comienza con el árbol más corto deComienza con el árbol más corto de 3-taxa añadiendo otros taxa en un orden que 3-taxa añadiendo otros taxa en un orden que

produce el menor incremento en el largo del produce el menor incremento en el largo del árbol.árbol.

SimpleSimple – – El primer taxón en la matriz es tomado El primer taxón en la matriz es tomado como referencia (taxa son añadidos considerando como referencia (taxa son añadidos considerando un orden decreciente de similaridad a la un orden decreciente de similaridad a la referencia).referencia).

RandomRandom - - taxa son añadidos en una secuencia al taxa son añadidos en una secuencia al azar, muchas secuencias distintas son usadas. azar, muchas secuencias distintas son usadas. Se recomienda usar Random cuando son muchas Se recomienda usar Random cuando son muchas OTUs (10-100).OTUs (10-100).

Page 11: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda heurísticaBúsqueda heurística

Branch Swapping (intercambiando Branch Swapping (intercambiando ramas):ramas):

Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI) Subtree pruning and regrafting Subtree pruning and regrafting

(SPR) (corte e injerto)(SPR) (corte e injerto) Tree bisection and reconnection Tree bisection and reconnection

(TBR)(TBR)

Page 12: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda heurísticaBúsqueda heurística

Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI)

A

B

C DE

F

G

A

B

D CE

F

G

A

B

C D

E

F

G

Page 13: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda heurísticaBúsqueda heurística

Subtree pruning and regrafting (SPR)Subtree pruning and regrafting (SPR)

A

B

C DE

F

G

A

B

C DE

F

G

C

D

G

B

A

E F

(corte e injerto)(corte e injerto)

PAUP permite 2 cortesPAUP permite 2 cortesNONA hasta 10 cortesNONA hasta 10 cortes

Page 14: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda heurísticaBúsqueda heurística

Tree bisection and reconnection (TBR)Tree bisection and reconnection (TBR)

A

B

C DE

F

G

A

B

CD

E

F

G

A

C

F

D

E

B G

PAUP permite 2 cortesPAUP permite 2 cortesNONA hasta 10 cortesNONA hasta 10 cortes

Page 15: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Búsqueda heurísticaBúsqueda heurística Branch SwappingBranch Swapping Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR)Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TBR)Tree bisection and reconnection (TBR) Por la naturaleza de búsqueda heurística no Por la naturaleza de búsqueda heurística no

podemos saber cual método es mejor..es decir podemos saber cual método es mejor..es decir cual método encontrará el árbol más cual método encontrará el árbol más parsimonioso ( o los arboles MP). parsimonioso ( o los arboles MP).

Consejo, TBR ( el más intensivo) usada junto con Consejo, TBR ( el más intensivo) usada junto con Random addition debería funcionar mejor.Random addition debería funcionar mejor.

Page 16: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

El Espacio de arboles puede ser “habitado” por minimos El Espacio de arboles puede ser “habitado” por minimos locales e islas de arboleslocales e islas de arboles

MÍNIMO LOCAL

Largodelárbol

SECUENCIA DE RÉPLICAS DE RANDOM ADDITION

CORRECTAEQUIVOCA EQUIVOCA

Branch SwappingBranch Swapping

Branch Swapping

MÍNIMOGLOBAL

MÍNIMO LOCAL

Page 17: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

BUSCANDO CON RESTRICCIONES BUSCANDO CON RESTRICCIONES TOPOLOGICAS (topological constraints)TOPOLOGICAS (topological constraints)

““Topological constraints” son hipótesis filogenéticas Topological constraints” son hipótesis filogenéticas definidas por el usuario.definidas por el usuario.

Pueden ser usadas para encontrar arboles óptimos Pueden ser usadas para encontrar arboles óptimos cuando:cuando:

1. Se incluye un clado específico o un set de 1. Se incluye un clado específico o un set de relaciones específicas.relaciones específicas.

2. Se excluye un clado especifico o un set de 2. Se excluye un clado especifico o un set de relaciones específicas. (reverse constraint)relaciones específicas. (reverse constraint)

Page 18: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Buscando usando “topological Buscando usando “topological constraints”constraints”

A B C D E F G

ABCDEFG

((A,B,C,D)(E,F,G))

A B C D E F G

ABCDEFG

A B C E D F G

Compatible con constraint tree

CONSTRAINT TREE

Incompatible con reverse constraint tree

Compatible con reverse constraint treeIncompatible con constraint tree

Page 19: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Buscando usando “topological Buscando usando “topological constraints” constraints”

“backbone constraints”“backbone constraints” ““Backbone constraints” especifica relaciones entre un subgrupo de taxaBackbone constraints” especifica relaciones entre un subgrupo de taxa

A B D E

A B D E

A D B E

Posiciones posibles de taxon CCompatible con backbone constraintIncompatible con reverse constraint

Incompatible con backbone constraintCompatible con reverse constraint

BACKBONE CONSTRAINT((A,B)(D,E))

Relaciones de taxon C no son especificadas

Page 20: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Datos faltantes (“missing data”)Datos faltantes (“missing data”) ““Missing data” son ignorados en la construcción de un árbol pero pueden Missing data” son ignorados en la construcción de un árbol pero pueden

llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en ausencia de homoplasía. ausencia de homoplasía.

A B C D E

**

Origen único0 => 1En cualquierade las tres ramas

1 ? ? 0 0

*

Muchos datos faltantes en la matriz pueden llevar a multiples arboles igualmente parsimoniosos. (Problema más serio cuando se analizan datos morfológicos que datos moleculares)

Page 21: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Arboles OptimosArboles Optimos

La mayoría de los métodos nos llevan La mayoría de los métodos nos llevan a encontrar múltiples árboles a encontrar múltiples árboles igualmente parsimoniosos .igualmente parsimoniosos .

Podemos seleccionar entre ellos Podemos seleccionar entre ellos usando criterios adicionales…. usando criterios adicionales….

Es una práctica común utilizar árboles Es una práctica común utilizar árboles de consenso.de consenso.

Page 22: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Métodos de ConsensoMétodos de Consenso

Arbol de Consenso: resumen del acuerdo Arbol de Consenso: resumen del acuerdo entre los arboles encontrados. entre los arboles encontrados.

Los Métodos de Consenso puedens ser Los Métodos de Consenso puedens ser usados en:usados en:

a) Múltiples arboles de un análisis.a) Múltiples arboles de un análisis.

b) Múltiples análisisb) Múltiples análisis

SUPERTREES (debate!!)SUPERTREES (debate!!)

Page 23: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Método de Consenso EstrictoMétodo de Consenso Estricto

A B C D E F G A B C E D F G

A B C D E F G

Page 24: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Método de Consenso de MayoríaMétodo de Consenso de Mayoría

A B C D E F G A B C E D F G

A B C E D F G

A B C E F D G

100

66

66

66

66

Page 25: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Método de Consenso reducido Método de Consenso reducido (Reduced consensus)(Reduced consensus)

A B C D E F G

STRICT REDUCED CONSENSUS TREE Taxon G es excluído

A G B C D E F

A B C D E F

A B C D E F G

Consenso Estricto NO Resuelve

ProgramaPrograma

RadConRadCon

Page 26: WAGNER LINNEO MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN.

Método de ConsensoMétodo de Consenso Use Consenso Estricto para identificar aquellas Use Consenso Estricto para identificar aquellas

relaciones que se sostiene en forma inambigua relaciones que se sostiene en forma inambigua para una interpretación por parsimonia de los para una interpretación por parsimonia de los datos. datos.

Use Métodos del Consenso Reducido donde Use Métodos del Consenso Reducido donde arboles de consenso tiene poca resolución.arboles de consenso tiene poca resolución.

Use Método de mayoría cuando haga bootstrapsUse Método de mayoría cuando haga bootstraps..