Alineamiento de Secuencias Biológicas. Generalidades Bases Aminoácidos Proteinas Alineamiento de...

Alineamiento de Secuencias Biológicas

Generalidades

• Bases

• Aminoácidos

• Proteinas

• Alineamiento de secuencias

• El DNA y las proteínas son macromoléculas biológicas construidas como cadenas lineales de componentes químicos. En el caso del DNA estos componentes son los nucleótidos, de los cuales hay cuatro diferentes. Cada uno denotado por una de las letras A, C, G y T. Las proteínas están compuestas de 20 diversos aminoácidos (o de " residuos ") que serán denotados por 20 diferentes letras del alfabeto.

Nucleótidos

DNA Adenina Guanina Citosina Tiamina

A G C T/U

RNA Adenina Guanine Cytosine Uracil

AminoácidosOne-letter code Three-letter-code Name

1 A Ala Alanine

2 C Cys Cysteine

3 D Asp Aspartic Acid

4 E Glu Glutamic Acid

5 F Phe Phenylalanine

6 G Gly Glycine

7 H His Histidine

8 I Ile Isoleucine

9 K Lys Lysine

10 L Leu Leucine

11 M Met Methionine

12 N Asn Asparagine

13 P Pro Proline

14 Q Gln Glutamine

15 R Arg Arginine

16 S Ser Serine

17 T Thr Threonine

18 V Val Valine

19 W Trp Tryptophan

20 Y Tyr Tyrosine

Alineamiento de Secuencias

• Comparar secuencias consiste en buscar todas las Comparar secuencias consiste en buscar todas las zonas de similitud significativa entre dos o más zonas de similitud significativa entre dos o más secuenciassecuencias

ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC | | | | | | | | | | | | | | | || | | | | | | | | | | | | | | |

CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCATCGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT

ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGCATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | || | | | | | | CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCATCGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT

Sitios comunes: Sitios comunes: | |

desplazar una de las secuencias dos posiciones desplazar una de las secuencias dos posiciones

Alineamiento GlobalAlgoritmo de Needleman-Wunsch

Encuentra el alineamiento global de dos secuencias vía Programación Dinámica

• Inicialización

• Llenado de Matriz (scoring)

• Recuperación de la solución (Backtracking)

Recursión del alineamientoRecursión del alineamiento

F(i, j)= maxF(i, j)= maxF(i-1, j-1)+s(i,j)F(i-1, j-1)+s(i,j)

F(i-1, j)-wF(i-1, j)-w

F(i, j-1)-wF(i, j-1)-w

F(i-1,j-1) F(i,j-1)

F(i-1,j) F(i, j)

w=Penalización Hueco

S(i,j) Función de similitud

Recursión del alineamientoRecursión del alineamiento

G A A T T C A G T T A (secuencia #1) G A A T T C A G T T A (secuencia #1)

G G A T C G A (secuencia #2) G G A T C G A (secuencia #2)

M = 11M = 11, , longitud de la secuencia #1 y longitud de la secuencia #1 y

N = 7N = 7, , longitud de la secuencia #2longitud de la secuencia #2

Inicialización

crear una matriz de M+1 columnas y N+1. La primera fìla y la crear una matriz de M+1 columnas y N+1. La primera fìla y la primera columnprimera columnaa son rellenadas con cero son rellenadas con cero

Llenar Matriz (scoring)

El llenado de la matriz corresponde a dar un valor a la intersección El llenado de la matriz corresponde a dar un valor a la intersección de las filas y las columnas, según el esquema de puntajesde las filas y las columnas, según el esquema de puntajes

Llenar Matriz (Llenar Matriz (scoringscoring))

Recuperación de la solución (Backtracking)

Consiste en tomar la última coincidencia del alineamiento y comenzar a buscar el Consiste en tomar la última coincidencia del alineamiento y comenzar a buscar el camino que maximice la funcióncamino que maximice la función

El máximo alineamiento es de 6 . El máximo alineamiento es de 6 .

El retroceso comienza en la posición M,J de la matriz en la posición donde se El retroceso comienza en la posición M,J de la matriz en la posición donde se presenta el mpresenta el mááximo puntaje del alineamiento. El algoritmo recorre los vecinos de ximo puntaje del alineamiento. El algoritmo recorre los vecinos de la celda actual para identificar sus predecesores. Esto es mira los vecinos a la la celda actual para identificar sus predecesores. Esto es mira los vecinos a la izquierda , el vecino diagonal y el vecino de arriba. Se marcan en rojo los izquierda , el vecino diagonal y el vecino de arriba. Se marcan en rojo los posibles vecinos. En el ejemplo son todos iguales a 5posibles vecinos. En el ejemplo son todos iguales a 5

Si la posición inicial no tuviera coincidencia cualquiera de los vecinos son Si la posición inicial no tuviera coincidencia cualquiera de los vecinos son validos para comenzar a realizar el alineamientovalidos para comenzar a realizar el alineamiento

Todos generan un alineamiento diferente, por lo tanto es importante analizar Todos generan un alineamiento diferente, por lo tanto es importante analizar desde el punto de vista de los pesos el mejor camino y tomarlodesde el punto de vista de los pesos el mejor camino y tomarlo

Se marcan en rojo los posibles vecinos. En el ejemplo son todos iguales a 5

Una vez determinado el màximo valor se comienza a subir por la diagonal de la matriz buscando el camino que maximiza la funciòn.

Al verificar los vecinos los valores posibles son 4 y 5. El valor Al verificar los vecinos los valores posibles son 4 y 5. El valor que maximiza la función es MAX(4,4,5) = 5 El camino a tomar que maximiza la función es MAX(4,4,5) = 5 El camino a tomar es el 5, para lo cual se debe de desplazar una columna a la es el 5, para lo cual se debe de desplazar una columna a la izquierda del valor que se esta maximizandoizquierda del valor que se esta maximizando

Así sucesivamente se va recorriendo la matriz, siempre teniendo Así sucesivamente se va recorriendo la matriz, siempre teniendo presente que cuando en un punto todos los puntajes son iguales y presente que cuando en un punto todos los puntajes son iguales y la penalización es igual, se puede tomar cualquier camino la penalización es igual, se puede tomar cualquier camino generando múltiples solucionesgenerando múltiples soluciones

AlineamientoAlineamiento::

G A A T T C A G T T AG A A T T C A G T T A

| | | | | | | | | | | |

G G A _ T C _ G _ _ AG G A _ T C _ G _ _ A

SoluciónSolución alterna alternativativa: :

AlineamientoAlineamiento::

G _ A A T T C A G T T AG _ A A T T C A G T T A

| | | | | | | | | | | |

G G _ A _ T C _ G _ _ AG G _ A _ T C _ G _ _ A

CaracterísticasCaracterísticas

Cualquier prefijo del alineamiento óptimo entre Cualquier prefijo del alineamiento óptimo entre xx y y yy es un alineamiento óptimo entre un prefijo es un alineamiento óptimo entre un prefijo xx1...i1...i

de de xx y un prefijo y un prefijo yy1...j1...j de de yy

F(F(i, ji, j)=maximo puntaje de un alineamiento entre )=maximo puntaje de un alineamiento entre xx1...1...ii

y y yy1...1...jj

F(F(n, mn, m)=maximo puntaje de un alineamiento global )=maximo puntaje de un alineamiento global entre entre xx y y yy

El valor El valor F(F(i, ji, j)) depende solamente de los valores depende solamente de los valores F(F(i-i-11, j-, j-11)), , F(F(i-i-11, j, j)) F(F(i, j -i, j -11))

un alineamiento óptimo entre un alineamiento óptimo entre xx1...1...ii y y yy1...1...jj consiste deconsiste de

Un alineamiento óptimo entre Un alineamiento óptimo entre xx1 ... (1 ... (i-1)i-1) y y yy1 ... (1 ... (j-1)j-1) extendido extendido

con una coincidencia entre con una coincidencia entre xxii y y yyjj; ;

Un alineamiento óptimo entre Un alineamiento óptimo entre xx1 ... (1 ... (i-1)i-1) y y yy1 ... 1 ... jj extendido extendido

con una coincidencia entre con una coincidencia entre xxii y un hueco; oy un hueco; o

Un alineamiento óptimo entre Un alineamiento óptimo entre xx1 ... 1 ... ii y y yy1 ... (1 ... (j-1)j-1) extendido extendido

con una coincidencia entre un hueco y con una coincidencia entre un hueco y yyii

Cuando se llena F(i, j), se almacena el rastro (Backtracking) B(i, j) desde (i, j)

el BackTracking apunta a la celda que produjo el máximo puntaje: (i-1, j-1) o (i-1, j) o (i, j -1)

Al terminar, se encuentra un alineamiento óptimo siguiendo el rastro desde (n, m) hasta (0, 0)

Cómo encontrar un alineamiento óptimo?

Needleman-WunschNeedleman-Wunsch

PenalPenalización: ización: -0.5 -0.5 para las no coincidenciaspara las no coincidencias

Alineamiento de Secuencias Biológicas. Generalidades Bases Aminoácidos Proteinas Alineamiento de...

Documents

Transcript of Alineamiento de Secuencias Biológicas. Generalidades Bases Aminoácidos Proteinas Alineamiento de...

Alineamiento de secuencias - UGR · 2016-11-06 · horizontal de genes. ... Matriz de puntos: alineamiento de secuencias c) Las dos secuencias difieren por una inserción/deleción

IV Alineamiento múltiple de secuencias Andrés Moreira Departamento de Informática UTFSM.

Alineamiento de dos secuencias. Para alinear dos secuencias de longitud n y m, respectivamente, se colocan una encima de la otra de manera que el número.

TIEMPO A LA ESPLENECTOMIA COMO FACTOR … · mimetismo molecular, bien documentado entre secuencias especificas de aminoácidos ... Hepatitis C, VIH, Helicobacter pylori, Citomegalovirus,

Alineamiento de secuencias - UGR€¦ · • Se randomiza la segunda secuencia 100 veces, permutando al azar (‘shuffling’) las posiciones que ocupan los aminoácidos (manteniendo

Síntesis y determinación estructural de péptidos derivados ...diferentes secuencias peptídicas. Para estas secuencias se varió la concentración de activadores, aminoácidos y

Alineamiento de secuencias O (m × n). Alineamiento de secuencias Dot-plot (Gibbs and McIntyre, 1970)

Bioinformática 2007-I Prof. Mirko Zimic Lunes -Alineamiento simple de secuencias (pairwise alignment). - Alineamiento local y global. - Matrices de ‘score’

ST.25 - Norma para la presentacion de listas de secuencias ... · iv) por “aminoácidos” se entenderán los L-aminoácidos que se encuentran comúnmente en las proteínas naturales

Alineamiento de pares de secuenciasertello/bioinfo/sesion05.pdf · 2014-07-17 · Alineamiento de pares de secuencias Evolución de secuencias Evolución de secuencias Durante este

1 Fernán Agüero Alineamiento de secuencias Búsqueda de secuencias en bases de datos Fernán Agüero Instituto de Investigaciones Biotecnológicas Universidad.

Alineamiento de secuencias - bioinfo2.ugr.esbioinfo2.ugr.es/presentaciones/secuencias/Alineamiento de... · horizontal de genes. ... El alineamiento 1 supondría en total cinco huecos

UN ENFOQUE MULTIOBJETIVO AL ALINEAMIENTO MÚTIPLE DE SECUENCIAS · 2020. 4. 28. · una de las columnas del alineamiento menos el puntaje de penalización a los gaps afines de cada

Alineamiento de secuencias múltiples

Alineamiento de secuencias múltiples ¿ Por qué alinear simultáneamente varias secuencias? Un ejemplo claro de este caso sería comparar proteínas muy conservadas.

Alineamiento Múltiple de Secuencias con T-Coffee: Una ... · secuencias biológicas y qué métodos se emplean paraintentar resolver el problema. Se mostrará que la única vía

IV Alineamiento múltiple de secuencias

Alineamiento múltiple de secuencias PSI-BLAST. Alineamiento múltiple de secuencias Resumen de cómo se utiliza PSI-BLAST.

Capitulo 3 Alineamiento Secuencias Amino Cidos GQAC

Genes Problemas - NJCTLcontent.njctl.org/courses/science-espanol/biology-en... · 2015. 9. 14. · Proporciona el ARNm, el ARNt y las secuencias de aminoácidos relacionadas. TACGGTCTACCGACT