Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo...
Transcript of Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo...
![Page 1: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/1.jpg)
Práctica 3 - MafftPablo Luesia
Juan José Gómez
David Guimerá
![Page 2: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/2.jpg)
Mafft - Introducción
u Es una herramienta para alineamiento de secuencias.
u Esta disponible tanto online como para descargar en los principales sistemas operativos.
![Page 3: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/3.jpg)
Mafft - ¿Cómo usarlo?
u Se puede descargar desde la web oficial para diferentes sistemas operativos (Mac OS X, Linux y Windows).
u También tiene una versión web (la que vamos a utilizar en la sesión)
![Page 4: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/4.jpg)
Mafft – Versión web
![Page 5: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/5.jpg)
Mafft - Características
u La base de su algoritmo esta fundamentado en la Transformada Rápida de Fourier (FFT).
u Ofrece un amplio abanico de algoritmos, los cuales estas orientados a dos objetivos: precisión de los resultados o eficiencia.
![Page 6: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/6.jpg)
Selección algoritmo Mafft – Scrollversión online
![Page 7: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/7.jpg)
Mafft – Algoritmos orientados a precisión
u L-INS-i: método de los mas precisos. Recomendado cuando se pretenden alienar menos de 200 secuencias. Es iterativo.
u G-INS-i: método apropiado para secuencias de longitudes similares y recomendado para cuando se pretenden alinear menos de 200 secuencias.
u E-INS-i: método recomendado para secuencias que contienen largas regiones difilmente alineables (muchos gaps). De nuevo, recomendado para cuando se quiere alinear menos de 200 secuencias.
![Page 8: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/8.jpg)
Mafft – Algoritmos orientados a eficiencia
u FFT-NS-1: método muy rápido recomendado para menos de 2000 secuencias.
u FFT-NS-2: método progresivo algo mas lento que el anterior.
![Page 9: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/9.jpg)
Mafft – Otras opciones (1)
u Alinear segmentos no relacionados: Permite realizar alineamientos globales de secuencias similares ignorando secuencias con grandes diferencias. Contempla subsecuencias posiblemente contaminadas que provocarían grandes secuencias de gaps en el alineamiento.
u Esta opción solo esta disponible con el algoritmo G-INS-i y no esta recomendada para cuando se intentan alinear mas de 100 secuencias.
![Page 10: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/10.jpg)
Mafft – Otras opciones (2)
u Scoring: se pueden modificar los parámetros del scoring, como la penalización de añadir gaps (1.53 por defecto) o la matriz de puntuación para secuencias de aminoácidos y nucleótidos.
u Árbol guía: se puede cambiar el algoritmo para generar el árbol guía.
![Page 11: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/11.jpg)
Mafft – Otras opciones (3)
u Se puede mejorar la precisión de un alineamiento utilizando las secuencias homologas a las de entrada. Mafft sigue los siguientes pasos:
u -Busca un numero especificado por el usuario de secuencias homologas con una distancia máxima introducida por el usuario
u -Alinea las secuencias de entrada y sus homologas usando el algoritmo L-INS-i
u -Elimina las secuencias homologas.
![Page 12: Práctica 3 -Mafftwebdiis.unizar.es/asignaturas/Bio/wp-content/... · Práctica 3 -Mafft Pablo Luesia ... uTambién tiene una versión web (la que vamos a utilizar en la sesión)](https://reader033.fdocuments.es/reader033/viewer/2022043012/5fab5ec309f6351314081ba0/html5/thumbnails/12.jpg)
Mafft - Limitaciones
u En general, es poco escalable para largas secuencias de DNA. Incluso los algoritmos mas eficientes (por ejemplo FFS-NS-2) intentan usar una rigurosa programación dinámica que toma mucho tiempo de CPU. En esos casos, es mas recomendable usar FAST y BLAST.
u Se asume que el orden de los bloques alineables es conservado para todas las secuencias de entrada.