¿Es el árbol intersección la mejor representación de los...

14
¿Es el árbol intersección la mejor representación de los árboles obtenidos en NO5? Erika Adriana Serrano Romero Universidad industrial de Santander Introducción El programa Nelson 05 (NO5) combina los resultados de los cladogramas taxón-áreas óptimos mediante el árbol intersección (AINT) construido por los 3is compatibles presentes en los cladogramas óptimos. Esta representación se ha considerado como la mejor ya que resume la información inicial de manera precisa lo que no se logra con la parsimonía y el consenso estricto (Cao et al., 2009). El objetivo de este trabajo es evaluar si el AINT es la mejor representación de los cladogramas taxón-áreas óptimos obtenidos con N05 versus 5 tipos de consenso, el estricto, de la mayoría, semiestricto, de Nelson y de Adams. Materiales y Métodos Se utilizaron 22 set de datos que se presentan en la Tabla 1 junto con sus referencias. Se realizo un análisis de subárboles libres de paralogía que incluye el método transparente para eliminar la paralogía y el análisis de tres afirmaciones (3is), con el programa Nelson 05 (Cao et al., 2007) el cual utiliza un algoritmo original de compatibilidad para buscar los cladogramas taxón-área óptimos a partir de los 3is obtenidos de los árboles de origen, se utilizo una búsqueda de branch and bound y el comando –v que produce resultados más detallados en la etapa de descomposición de los cladogramas de áreas en 3is. Cuando se produjo más de un árbol resultado de la búsqueda (árboles óptimos retenidos) se realizó un consenso estricto, de la mayoría, semiestricto, de Nelson y de Adams utilizando el programa Component 2.0 (Page, 1993) comparando el resultado de los consensos y del AINT obtenido con el subprograma Prtts que es llamado por tts el subprograma principal de NO5 para la reconstrucción del árbol intersección. Los data sets que produjeron diferencias entre los consensos y el AINT se analizaron detalladamente Resultados La Tabla 2 muestra los set de datos que produjeron diferencias entre los consensos y el AINT también se especifica el número de terminales y el número de árboles retenidos producidos por la búsqueda. Las Figuras 1-4 muestra los consensos y los árboles intersección para los 4 data sets y las figuras 5-8 muestran las tablas de clusters, las matrices de compatibilidad, los cliques más grandes y la partición verdadera de los cliques que se obtienen en Component 2.0 durante el cálculo de los consensos (tabla de clusters) y del consenso de Nelson. Los data set 12 y 13 son ficticios y se realizaron para probar 2 cosas, que el AINT no tiene en cuenta una ponderación del número de topologías con 3is en común Vs alguna contradictoria (Exp1) y si las topologías de origen no comparten ningún 3is no se produce AINT (Lizards, Frogs and Birds). Los resultados de todos los análisis y los scripts se encuentran en el material adicional. Discusión de Resultados Para todos los data sets el consenso estricto y semiestricto producen los mismos resultados ya que los cladogramas óptimos obtenidos de NO5 son

Transcript of ¿Es el árbol intersección la mejor representación de los...

Page 1: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

¿Es el árbol intersección la mejor representación de los árboles obtenidos en NO5?

Erika Adriana Serrano Romero Universidad industrial de Santander

Introducción El programa Nelson 05 (NO5) combina los resultados de los cladogramas taxón-áreas óptimos mediante el árbol intersección (AINT) construido por los 3is compatibles presentes en los cladogramas óptimos. Esta representación se ha considerado como la mejor ya que resume la información inicial de manera precisa lo que no se logra con la parsimonía y el consenso estricto (Cao et al., 2009). El objetivo de este trabajo es evaluar si el AINT es la mejor representación de los cladogramas taxón-áreas óptimos obtenidos con N05 versus 5 tipos de consenso, el estricto, de la mayoría, semiestricto, de Nelson y de Adams. Materiales y Métodos Se utilizaron 22 set de datos que se presentan en la Tabla 1 junto con sus referencias. Se realizo un análisis de subárboles libres de paralogía que incluye el método transparente para eliminar la paralogía y el análisis de tres afirmaciones (3is), con el programa Nelson 05 (Cao et al., 2007) el cual utiliza un algoritmo original de compatibilidad para buscar los cladogramas taxón-área óptimos a partir de los 3is obtenidos de los árboles de origen, se utilizo una búsqueda de branch and bound y el comando –v que produce resultados más detallados en la etapa de descomposición de los cladogramas de áreas en 3is. Cuando se produjo más de un árbol resultado de la búsqueda (árboles óptimos retenidos) se realizó un consenso estricto, de la mayoría, semiestricto, de Nelson y de Adams utilizando el programa Component 2.0 (Page, 1993) comparando el resultado de los consensos y del AINT obtenido con el subprograma Prtts que es llamado por tts el subprograma principal de NO5 para la reconstrucción del árbol intersección. Los data sets que produjeron diferencias entre los consensos y el AINT se analizaron detalladamente Resultados La Tabla 2 muestra los set de datos que produjeron diferencias entre los consensos y el AINT también se especifica el número de terminales y el número de árboles retenidos producidos por la búsqueda. Las Figuras 1-4 muestra los consensos y los árboles intersección para los 4 data sets y las figuras 5-8 muestran las tablas de clusters, las matrices de compatibilidad, los cliques más grandes y la partición verdadera de los cliques que se obtienen en Component 2.0 durante el cálculo de los consensos (tabla de clusters) y del consenso de Nelson. Los data set 12 y 13 son ficticios y se realizaron para probar 2 cosas, que el AINT no tiene en cuenta una ponderación del número de topologías con 3is en común Vs alguna contradictoria (Exp1) y si las topologías de origen no comparten ningún 3is no se produce AINT (Lizards, Frogs and Birds). Los resultados de todos los análisis y los scripts se encuentran en el material adicional. Discusión de Resultados Para todos los data sets el consenso estricto y semiestricto producen los mismos resultados ya que los cladogramas óptimos obtenidos de NO5 son

Page 2: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

estrictamente dicotómicos (Bryant, 2003). En la posterior discusión los clusters los voy a escribir en paréntesis pero sin comas entre las terminales. Data set 1.En el consenso se evidencia la relación (AF, AG) es decir que esta presente en los 318 árboles y se recupera en los demás consensos y en el AINT. Las relaciones en la tricotomía AA, AB, (AC AI AH AK AE AD): El cluster 27 (AA, AB) y el 13 (AH, AK) se definen en el consenso de Nelson por que aunque no esta en la mayoría de los árboles (mínimo 160) sólo en 106 y 108 se encuentran dentro de los cliques más grandes (partición verdadera). El cluster 20 (AI AJ AH AK) aparece en 180 árboles se encuentra tanto en el consenso de Nelson y de la mayoría El terminal AE solo comparte el nodo basal con todos los demás árboles y se encuentra solo en la posición ABS “(ABS (PRES1 PRES2))” junto con AI AJ AH y (AF,AG). La relación AA, AB, (AD, (AC, (AH, AI, AJ, AK)→G3 en el árbol intersección aparece no resuelta por que hay varios 3is en la intersección que ligan a AA como hermano de cada uno de los miembros del G3. Data set 2. Todos los consensos y el AINT son iguales excepto el de Nelson. AM no hace parte de la politomía (AJ, AK, AM) si no que es hermana del cluster 14, los clusters 3 y 14 presentes en la partición verdadera definen esta relación. En el consenso de la mayoría esta no se resuelve por que la mitad de los árboles presentan la relación AJ, (AH, (AG, (AN, AC))) y la otra mitad AK, (AH, (AG, (AN, AC))) lo mismo sucede en el cluster 8 y el cluster 6. La relación (AK, AJ, AM) no se resuelve en el consenso de Adams por que ese nodo es el que tienen en común. En el AINT no se resuelve por hay diferentes 3is en la intersección que ligan AM de manera diferente a los terminales de “más internos”. Data set 3. En el consenso estricto aparece el grupo ((AD, AJ), (AG, (AF, AE))) y se recupera en todos los consensos y el AINT. Los dos grupos de consensos el de la mayoría, Nelson y el grupo consenso de Adams, AINT están igualmente resueltos al presentar el primero una tetratomía y el segundo dos tricotomías. El grupo (AB, AC) se resuelve en todos menos en el consenso estricto. El consenso de Nelson y de la mayoría resuelve a AA como externo por que el cluster 6 se encuentra en 41 árboles, el árbol intersección no logra definir esta relación por que no hay entre los 3is de la intersección alguno que defina la relación AA, (AH, AI, AK) y en el de Adams por que el nodo común para ((AB, AC), ((AD, AJ), (AG, (AE, AF)))) el grupo (AH, AI, AK) y el terminal AA entre todos los árboles es el basal. El consenso de Nelson recupera el grupo ((A,B), AH,AK,AI) por que el cluster 33 se encuentra en 35 árboles y pertenece a los cliques más grandes. El grupo (AH, AI, AK) se lleva al nodo basal en el consenso de Adams por que es el nodo “ancestral” más reciente entre los grupos de la tricotomía el terminal AA y el grupo restante. En el árbol intersección este grupo queda por fuera por

Page 3: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

que hay varios 3is que ligan a AH, AI y AK entre sí las relaciones PRES 1, PRES2, pero también varios 3is (compatibles pero distintos) del tipo AH (AE,AG) ligan estas 3 terminales en la posición ABS con terminales “internas”. De esta forma se pierde la información que en la mayoría de los árboles óptimos ((A,B), AH,AK,AI) se encuentran formando un grupo. Data set 4. El consenso estricto no resuelve nada, la separación de A del grupo interno en el consenso de la mayoría y en el de Nelson se da por que el cluster 57 (B, C, D, E, F, G, H, I) esta presente en 607 árboles y ausente en los árboles 169 y 170, el otro cluster que se evidencia es el 47 (C, D, E, G, H, I). En el consenso de Nelson se recupera la relación (D, E) en el cluster 1 y la relación (H, I) en el cluster 33 estos dos clusters son compatibles (y se unen) en el cluster 38 formando el extraño grupo ((D, E), (H, I)) En el data set 1, 2, y 3 el consenso de Nelson es más resuelto que el AINT, además es el único de los consensos en el data set 4(exceptuando al de adams, igual al del AINT) que recupera los grupos (D, E) y (H, I) . En el data set 4 ambos consensos dan “igual” resolución pero de diferente forma. El consenso de Adams es igual que el AINT en los data set 4 y 5. Hay que resaltar que el ejemplo utilizado por Cao et al. (2009) es un mal ejemplo para los análisis de biogeografía cladistica ya que el único taxón común entre las dos topologías es el A es decir una sola área común algo que sería muy reprochable en un set de datos real. En los set de datos reales tenemos muchas más áreas comunes y se tiene la ventaja de tener más de dos filogenias (generalmente) por lo que se puede extraer más información utlizando el consenso de Nelson (los clusters más repetidos son aquellos que aparecen en el los cliques más grandes), ya que el enfoque de la búsqueda de N05 son las reconstrucciones de 3is que maximicen la compatibilidad es lógico que un consenso pensado en compatibilidad funcione mejor. Conclusión El consenso de Nelson representa mejor los cladogramas taxón-áreas óptimos en un análisis de Biogeografía Cladistica (utilizando diferentes filogenias distribuidas preferiblemente en todas las áreas de estudio o en al menos 3), dando como resultado una topología más resuelta.

Page 4: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Bibliografía Anaya,J.A. 2009. Biogeografía Histórica Australiana. Universidad Industrial de

Santander.

Arenas,S. 2009. Biogeografía de la Región Sunda basada en Herpetofauna. Universidad Industrial de Santander.

Bryant,D. 2003. A Classication of Consensus Methods for Phylogenetics. 163-184.

Cao N., Ducasse j. y Zaragüeta Bagils R. 2007. – NELSON05. – Publicado por los autores, Paris

Cao,N., Bourdon,E., El Azawi,M., and Zaragüeta Bagils,R. 2009. Three-item analysis

and parsimony, intersection tree and strict consensus: a biogeographical example. 13-15.

Dulcey,J.A. 2009. Historia biogeográfica del Paleártico. Universidad Industrial de Santander.

Flórez,A.L. 2009. Biogeografía del Pacífico Occidental y Sudeste Asiático con Géneros de la Familia Sapindaceae y Hemiptera. Universidad Industrial de Santander.

García,A. 2009. Biogeografía Histórica de Madagascar. Universidad Industrial de Santander.

Gualdrón,J.C. 2009. Biogeografía de Hawai. Universidad Industrial de Santander.

Mantilla,M.J. 2009. Biogeografía en el Holártico y regiones de Indo-China. Universidad Industrial de Santander.

Oróstegui,J.I. 2009. Biogeografía de Nueva Caledonia. U.

Ortiz,S. 2009. Biogeografía de Peces de Arrecife en el Océano Atlántico. Universidad Industrial de Santander.

Page,R.D.M. 1993. COMPONENT. Release 2.0. The Natural History Museum.

Pinzón,D.A. 2009. Biogeografía Histórica del Caribe. Universidad Industrial de Santander.

Porras,S. 2009. Historia Biogeográfica de la Zona de Transición Mexicana. Universidad Industrial de Santander.

Posadas,P., and Morrone,J.J. 2003. Biogeografía histórica de la familia Curculionidae (Coleoptera) en las regiones Subantártcia y Chilena Central. 75-84.

Rey,J.C. 2009. Biogeografía Histórica del Afrotrópico: Reconstrucción a partir de Herpetofauna y Roedores. Universidad Industrial de Santander.

Page 5: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Serrano,E.A. 2009. Biogeografía Histórica del Reino Austral. Universidad Industrial de Santander.

Torres,O.E. 2009. Análisis Biogeográfico del Holártico. Universidad Industrial de Santander.

Vargas,C.R. 2009. Biogeografía Histórica del Indo-Pacífico Occidental. Universidad Industrial de Santander.

Villarreal,L.C. 2009. Biogeografía Histórica desiertos Norte América. Universidad Industrial de Santander.

Zafra,F.A. 2009. Biogeografía Histórica del Sur de Sudamérica. Universidad Industrial de Santander.

Page 6: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

ANEXO 1. Tablas Tabla 1. Data sets utilizados en este trabajo.

Data set Referencia #Terminales

(áreas) # de árboles

retenidos en N05

Igualdad entre los 5 tipos de consenso

y el árbol intersección

Análisis en que los consensos y el arbol intersección son diferentes 1 (Flórez, 2009) 11 318 No 2 (Vargas, 2009) 15 8 No 3 (Anaya, 2009) 11 59 No 4 (Cao et al., 2009) 9 609 No

Análisis en que los consensos y el arbol intersección son iguales 5 (García, 2009) 8 2 Sí 6 (Serrano, 2009) 7 2 Sí 7 (Dulcey, 2009) 6 3 Sí 8 (Rey, 2009) 14 3 Sí 9 (Mantilla, 2009) 6 Sí

10 (Torres, 2009) 7 3 Sí 11 (Porras, 2009) 16 105 Sí 12 Exp1 5 2 Sí 13 Lizards,Birds and Frogs 3 2 Sí**

Análisis que solo retuvieron un árbol en la búsqueda por compatibilidad 14 (Pinzón, 2009) 7 1 N/A 15 (Gualdrón, 2009) 6 1 N/A 16 (Zafra, 2009) 7 1 N/A 17 (Oróstegui, 2009) 7 1 N/A 18 (Villarreal, 2009) 6 1 N/A 19 (Arenas, 2009) 6 1 N/A 20 (Ortiz, 2009) 9 1 N/A 21 (Posadas y Morrone, 2003) 6 1 N/A

Los 5 consensos calculados para cada data set son el consenso estricto, el consenso de la mayoría, el consenso semiestricto, el consenso de Nelson, el consenso de Adams. El árbol intersección es el obtenido por el subprograma Prtts parte de N05.** En este data set no se produjo árbol intersección. Tabla 2. Detalles de los Data set 1-5 para cada consenso y el árbol intersección

Data set C. estricto C. de la

mayoría C.

semiestricto C. Nelson C. de Adams

Árbol intersección

1 = A = B C D 2 = = = A = = 4 = A = A B B 5 = A = B C C

Las casillas con los iguales indican la identidad entre los diferentes consensos, las casillas que comparten letras entre filas representan igualdad entre esos consensos pero diferencia con el consenso estricto y demás.

Page 7: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

ANEXO 2. Figuras a) b)

c) d)

e)

Figura 1. Consensos para el data set 1. a) Consenso estricto y semiestricto. b) Consenso de la

mayoría. c) Consenso de Nelson. d) Consenso de Adams. e) Árbol intersección obtenido en NO5

Page 8: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

a) b)

Figura 2. Consensos para el data set 2. a) Consenso estricto, semiestricto, de la mayoría, de Adams

y árbol intersección obtenido en NO5. c) Consenso de Nelson Javiera a) b)

c)

Figura 3. . Consensos para el data set 3. a) Consenso estricto y semiestricto. b) Consenso de la

mayoría y de Nelson. d) Consenso de Adams y Árbol intersección obtenido en NO5

Page 9: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

a) b)

c) d)

e) f)

Figura 4. Consensos para el data set 4. a) y b) árboles de origen (sin previo análisis de NO5 ahí que diferenciarlos de los 609 árboles retenidos durante el análisis que se utilizaron como input para calcular los consensos). c) Consenso estricto y semiestricto. d) Consenso de la mayoría. e) Consenso de Nelson. f) Consenso de Adams y árbol intersección obtenido en NO5

Page 10: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Tabla de Clusters 1 1 1234567890 1 ---------- - 1 .**....... . 30 2 .*.*...... . 30 3 ..**...... . 54 4 .***...... . 18 5 ..*.*..... . 54 6 ...**..... . 54 7 ********** . 105 8 ..***..... . 54 9 .*........ * 45 10 ..*..*.... . 48 11 ...*.*.... . 48 12 ..**.*.... . 36 13 ....**.... . 108 14 .*..**.... . 18 15 ..*.**.... . 72 16 .**.**.... . 30 17 ...***.... . 72 18 ..***..... * 9 19 .*.***.... . 30 20 ..****.... . 180 21 .....*.... * 9 22 .*****.... . 210 23 ..****.... * 63 24 .*****.... * 213 25 .******... . 105 26 *******... . 35 27 *......*.. . 106 28 .******... * 213 29 *******... * 71 30 .*******.. . 35 31 ********.. . 105 32 .*******.. * 71 33 ********.. * 213 34 ........** . 318 Equivalencias 1 AA 2 AC 3 AI 4 AJ 5 AH 6 AK 7 AD 8 AB 9 AF 10 AG 11 AE

Matriz de compatibilidad 2| . 3| .. 4| 111 5| .1.. 6| 1.... 7| 111111 8| ..1.111 9| ..1.11.1 10| .1...11.1 11| 1...1.1.1. 12| ..1...1.11 1 13| 1111..1.1. .. 14| ..1...1... ..1 15| .1..1.1.11 ..1. 16| 1...1.1..1 ..111 17| 1....11.1. 1.1... 18| ..1.11.1.. ....... 19| .1...11... 1.11..1. 20| ..1.111111 111.1.1.. 21| 111111.1.. .......... 22| 11111111.1 1111111.11 . 23| ..1.11.1.1 111.1.11.1 1. 24| 111111.111 1111111111 111 25| 11111111.1 1111111.11 .1.. 26| 11111111.1 1111111.11 .1..1 27| 1111111111 1111111111 11111. 28| 111111.111 1111111111 11111.1 29| 111111.111 1111111111 111111.1 30| 11111111.1 1111111.11 .1..1.... 31| 11111111.1 1111111.11 .1..111..1 32| 111111.111 1111111111 11111..1.1 . 33| 111111.111 1111111111 1111111111 11 34| 1111111111 1111111111 1111111111 111 1 1111111112 2222222223 3333 1234567890 1234567890 1234567890 1234 ---------- ---------- ---------- ---- .......... .......... .......... ...* Cliques más grandes [ 13 15 20 22 24 27 28 33 34 ] [ 13 17 20 22 24 27 28 33 34 ] Partición verdadera de los cliques T:[ 13 20 22 24 27 28 33 34 ]

Figura 5. Tabla de Clusters (terminales= columnas, clusters= filas) y Matriz de Compatibilidad para el set de datos 1, también se presentan los cliques más grandes y cliques True (T), es decir aquellos que aparecen en el consenso de Nelson

Page 11: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Tabla de Clusters 1 11111 1234567890 12345 ---------- ----- 1 **........ ..... 8 2 ***....... ..... 8 3 ...******* ..... 8 4 ...**..... ..... 8 5 ********** ..... 8 6 ********** *.... 4 7 ...***.... ..... 8 8 ********** .*... 4 9 ********** **... 8 10 ...****... ..... 8 11 ********** ***.. 8 12 ...*****.. ..... 4 13 ...****.*. ..... 4 14 ...******. ..... 4 15 .......... ...** 8 16 ...*****.* ..... 2 17 ...****.** ..... 2 Equivalencias 1 AA 2 AI 3 AF 4 AC 5 AN 6 AG 7 AH 8 AJ 9 AK 10 AM 11 AB 12 AE 13 AL 14 AD 15 AO

Matriz de compatibilidad 2| 1 3| 11 4| 111 5| 1111 6| 11111 7| 111111 8| 11111.1 9| 11111111 10| 111111111 11| 1111111111 12| 1111111111 1 13| 1111111111 1. 14| 1111111111 111 15| 1111111111 1111 16| 1111111111 11..1 17| 1111111111 1.1.1. 1 1111111 1234567890 1234567 ---------- ------- *****.*.** *...*.. Cliques más grandes [ 1..7 9..12 14 15 ] [ 1..7 9..11 13..15 ] [ 1..5 7..11 13..15 ] [ 1..5 7..12 14 15 Partición verdadera de los cliques T:[ 1..5 7 9..11 14 15 ]

Figura 6. Tabla de Clusters (terminales= columnas, clusters= filas) y Matriz de Compatibilidad para el set de datos 2, también se presentan los cliques más grandes y cliques True (T), es decir aquellos que aparecen en el consenso de Nelson

Page 12: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Matriz de compatibilidad Tabla de Clusters 2| 1 1 1 3| 11 1234567890 1 4| 11. ---------- - 5| 11.. 1 .**....... . 39 6| 11.11 2 ...**..... . 59 7| 111111 3 *......... * 3 8| 1111111 4 .**....... * 3 9| 11111111 5 ...******* * 3 10| 111..1111 6 .********* * 41 11| 11....1111 7 .....**... . 59 12| 11.1..1111 . 8 .....***.. . 59 13| .11..1111. .. 9 ...*****.. . 59 14| .11..1111. ... 10 .*******.. . 21 15| 111..1111. ..11 11 ********.. . 3 16| 11..111111 1.... 12 *.......*. . 3 17| 111...1111 .1...1 13 .*......*. . 5 18| 11.1.1111. ..1111. 14 ..*.....*. . 5 19| 11.1..1111 ..1111.1 15 .**.....*. . 9 20| .11..1111. .1.1.11.. 16 ........*. * 11 21| .11..1111. .11..11... 17 *.......*. * 3 22| 111..1111. .1...11..1 1 18 .**.....*. * 5 23| 11..111111 11111..... .. 19 *........* . 3 24| 111...1111 ..111...1. ..1 20 .*.......* . 5 25| 11.1.1111. .1.......1 111. 21 ..*......* . 5 26| 1111111111 1......... ..... 22 .**......* . 9 27| 11.1..1111 .1......1. .....1 23 .........* * 11 28| .11..1111. ..1......1 .....1. 24 *........* * 3 29| .11..1111. ...1...... 1....1.. 25 .**......* * 5 30| 111..1111. ..111....1 11...1.11 26 ........** . 11 31| 11..111111 1....1.... ..1..1.... 27 *.......** . 3 32| 111...1111 .1...11.1. ..11.11... 1 28 .*......** . 3 33| 11.1.1111. ..1111.1.1 111.11.111 1. 29 ..*.....** . 3 30 .**.....** . 15 1 1111111112 2222222223 333 31 ........** * 15 1234567890 1234567890 1234567890 123 32 *.......** * 15 ---------- ---------- ---------- --- 33 .**.....** * 35 .*....***. .......... .......... ... 1 AA Cliques más grandes 2 AB [ 1 2 6..9 16 31 33 ] 3 AC [ 1 2 6..9 23 31 33 ] 4 AD [ 1 2 6..9 26 30 33 ] 5 AJ [ 1 2 6..9 26 31 33 ] 6 AE 7 AF 8 AG Partición verdadera de los cliques 9 AH T:[ 1 2 6..9 33 ] 10 AK 11 AI

Figura 7. Tabla de Clusters (terminales= columnas, clusters= filas) y Matriz de Compatibilidad para el set de datos 3, también se presentan los cliques más grandes y cliques True (T), es decir aquellos que aparecen en el consenso de Nelson

Page 13: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Tabla de Clusters 123456789 --------- 1 ...**.... 233 2 ..***.... 65 3 .****.... 9 4 *****.... 1 5 .*...*... 107 6 ..*..*... 43 7 ...*.*... 19 8 ....**... 19 9 ...***... 39 10 ..****... 35 11 .*****... 7 12 .*....*.. 43 13 ..*...*.. 59 14 ...*..*.. 43 15 ....*.*.. 43 16 ...**.*.. 63 17 ..***.*.. 35 18 .****.*.. 7 19 .*.....*. 19 20 ..*....*. 43 21 ...*...*. 63 22 ....*..*. 63 23 ...**..*. 75 24 ..***..*. 35 25 .****..*. 7 26 .*......* 19 27 ..*.....* 43 28 ...*....* 63 29 ....*...* 63 30 ...**...* 75 31 ..***...* 35 32 .****...* 7 33 .......** 233 34 .*.....** 39 35 ..*....** 63 36 ...*...** 75 37 ....*..** 75 38 ...**..** 195 39 ..***..** 175 40 .****..** 63 41 ......*** 65 42 .*....*** 35 43 ..*...*** 35 44 ...*..*** 35 45 ....*.*** 35 46 ...**.*** 175 47 ..***.*** 315 48 .****.*** 231 49 .....**** 9 50 *....**** 1 51 .*...**** 7 52 ..*..**** 7 53 ...*.**** 7 54 ....***** 7 55 ...****** 63 56 ..******* 231 57 .******** 607

Matriz de compatibilidad 2| 1 3| 11 4| 111 5| 11.. 6| 1.... 7| ...... 8| ....... 9| 1.....11 10| 11...1111 11| 111.111111 12| 11...11111 . 13| 1...1.111. .. 14| ....11.1.. ... 15| ....111... .... 16| 1...11.... ...11 17| 11..1..... ..1111 18| 111....... .111111 19| 11...11111 ..11111. 20| 1...1.111. .1.111... 21| ....11.1.. .11.1..... 22| ....111... .111...... . 23| 1...11.... .11....... 11 24| 11..1..... .1.......1 111 25| 111....... ........11 1111 26| 11...11111 ..11111..1 1111. 27| 1...1.111. .1.111..1. 111... 28| ....11.1.. .11.1...11 .1..... 29| ....111... .111....11 1....... 30| 1...11.... .11.....11 .......11 31| 11..1..... .1......1. ......1111 32| 111....... .......... .....11111 1 33| 1111111111 11111111.. .......... .. 34| 11...11111 ..11111.1. .....1.... ..1 35| 1...1.111. .1.111...1 ......1... ..1. 36| ....11.1.. .11.1..... 1......1.. ..1.. 37| ....111... .111...... .1......1. ..1... 38| 1...11.... .11....... 111....111 ..1..11 39| 11..1..... .1.......1 1111..1111 1.1.1111 40| 111....... ........11 1111111111 111111111 41| 1111111111 1......... .......... ..1....... 42| 11...11111 .1......1. .....1.... ..11...... 1 43| 1...1.111. ..1......1 ......1... ..1.1..... 1. 44| ....11.1.. ...1...... 1......1.. ..1..1.... 1.. 45| ....111... ....1..... .1......1. ..1...1... 1... 46| 1...11.... ...111.... 111....111 ..1..111.. 1..11 47| 11..1..... ..11111..1 1111..1111 1.1.11111. 1.1111 48| 111....... .111111111 1111111111 1111111111 1111111 49| 1111...... .......... .......... ..1....... 1....... 50| 111....... .......... .......... ..1....... 1.......1 51| 11..1..... .1......1. .....1.... ..11...... 11......1. 52| 1....1.... ..1......1 ......1... ..1.1..... 1.1.....1. . 53| ......1... ...1...... 1......1.. ..1..1.... 1..1....1. .. 54| .......1.. ....1..... .1......1. ..1...1... 1...1...1. ... 55| 1.....111. ...111.... 111....111 ..1..111.. 1..111..1. ..11 56| 11...11111 ..11111..1 1111..1111 1.1.11111. 1.11111.1. .1111 57| 111.111111 1111111111 1111111111 1111111111 111111111. 111111 1 1111111112 2222222223 3333333334 4444444445 5555555 1234567890 1234567890 1234567890 1234567890 1234567890 1234567 ---------- ---------- ---------- ---------- ---------- ------- .......... .......... .......... .......... .......... .......

Page 14: ¿Es el árbol intersección la mejor representación de los ...tux.uis.edu.co/labsist/docencia/finales/final2009-I/20070-2040006.pdf · ¿Es el árbol intersección la mejor representación

Cliques más grandes Equivalencias [ 1 33 38 46 47 56 57 ] 1 A [ 1 33 38 39 47 56 57 ] 2 B [ 1 33 38 46..48 57 ] 3 C [ 1 33 38 39 47 48 57 ] 4 D 5 E 6 F Partición verdadera de los cliques 7 G 8 H T:[ 1 33 38 47 57 ] 9 I Figura 8. Tabla de Clusters (terminales= columnas, clusters= filas) y Matriz de Compatibilidad para el set de datos

4, también se presentan los cliques más grandes y cliques True(T), es decir aquellos que aparecen en el consenso de N05