Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos...

17
Dinámica Molecular de Proteínas Dinámica Molecular de Proteínas Modelado y Simulación Computacional Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2 do cuatrimestre 2017 Escuela de Ciencia y Tecnología UNSAM

Transcript of Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos...

Page 1: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional

Profesores: Eliana K. Asciutto & Ignacio J. General2do cuatrimestre 2017

Escuela de Ciencia y TecnologíaUNSAM

Page 2: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional

Modelado homólogoModelado homólogo

Page 3: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

3

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Proteínas con secuencias similares tienen estructuras similares

LT G

GD

E

L T C G D D

Secuencia objetivo: LTCGDDSecuencia molde: LTGGDE

● Secuencia sin estructura conocida (objetivo):

● Busco una secuencia similar, con estructura conocida (molde):

● Copio la estructura:

● Refino la estructura:

LT

GD

CD

LT C G

D D

Secuencia modelada

Page 4: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

4

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Proteínas con secuencias similares tienen estructuras similares

Figura de Sander and Schneider (1991) Proteins 9:56-68:

La región segura región segura para modelado homólogo es la de arriba a la derecha.

Como regla general, no usar secuencias con identidad < 40%.

Page 5: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

5

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Pero...¡puede fallar!¡puede fallar!

Región amarilla: longitud de 80 aa, identidad > 40%Estructuras muy diferentesEstructuras muy diferentes

Cápside viral (1PIV) Glicosiltransferasa (1HMP)

Page 6: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

6

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

¿Por qué usar modelado homólogo?

● Hay > 100,000 estructuras en el PDB. Pero existen millones de secuencias. No siempre se tiene la estructura de interés

● Es mucho mas fácil que medir la estructura experimentalmente

● Sirve para estudiar algunas secuencias, a veces cualitativamente, a veces cuantitativamente.

● Se puede usar para predecir efectos de mutación, regiones de ligamiento, estabilidad, etc.

Page 7: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

7

Rodopsina Humana

Dinámica Molecular – UNSAM – 2017

Es una proteína transmembrana, foto-sensible, envuelta en la foto-transducción que inicia la visión humana.

¿Cómo hacer un modelo de Rodopsina?

By Dpryan at English Wikipedia (Transferred from en.wikipedia to Commons.) [Public domain], via Wikimedia Commons

Bicapa lipídicaRodopsina (GPCR)

Proteína G

Page 8: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

8

1- Secuencia de la Rodopsina (objetivo)

Dinámica Molecular – UNSAM – 2017

● Obtener la secuencia de la Rodopsina Humana, por ejemplo, en la base de datos http://www.uniprot.org/

● Elegir la opción P08100. Allí se describen las características conocidas de Rodopsina humana.

● Buscar la secuencia (o cliquear a la izquierda “secuencia”)● Bajar la secuencia en formato FASTA:>sp|P08100|OPSD_HUMAN Rhodopsin OS=Homo sapiens GN=RHO PE=1 SV=1MNGTEGPNFYVPFSNATGVVRSPFEYPQYYLAEPWQFSMLAAYMFLLIVLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVLGGFTSTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLAGWSRYIPEGLQCSCGIDYYTLKPEVNNESFVIYMFVVHFTIPMIIIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWVPYASVAFYIFTHQGSNFGPIFMTIPAFFAKSAAIYNPVIYIMMNKQFRNCMLTTICCGKNPLGDDEASATVSKTETSQVAPA

Page 9: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

9

2- Selección del molde

Dinámica Molecular – UNSAM – 2017

● La herramienta BLAST (Basic Local Alignment Search Tool), permite comparar una secuencia objetivo contra una base de datos.

● Hay muchas opciones:http://uniprot.org (website anterior)https://toolkit.tuebingen.mpg.de/#/tools/hhpred https://blast.ncbi.nlm.nih.gov/Blast.cgi Usemos https://blast.ncbi.nlm.nih.gov/Blast.cgi, seleccionando comparación contra el Protein Data Bank

● El sistema devuelve una lista de varias secuencias con ‘puntajes’: E-value (cuanto menor, mejor, <<1), porcentaje de similaridad, etc.

● Los puntajes son peores si hay indels (insertions/deletions), inserciones o vacíos en una de las dos secuencias comparadas.

Page 10: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

10

2- Selección del molde

Dinámica Molecular – UNSAM – 2017

● Usar secuencias solo con E < 1 y/o identidad > 40%.● Cualquiera de ellas? No, examinar las estructuras 3D, y

verificar que tengan buena resolución (1 o 2 Å), y pocos átomos faltantes.

● Una vez seleccionado el “mejor”, anotar el campo en la columna “Accession” (usar 1JFP_A, aunque no es el mejor); ese es el código PDB de la estructura. Cliquear ahí, y vamos a poder ver la secuencia en formato FASTA.

>1JFP:A|PDBID|CHAIN|SEQUENCEMNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA

Page 11: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

11

3- Alineación de secuencia

Dinámica Molecular – UNSAM – 2017

● Necesitamos ahora generar una alineación de las secuencias objetivo y molde.

● http://www.ebi.ac.uk/Tools/msa/clustalo/ ● Entrar las secuencias en formato FASTA de las secuencias

objetivo y molde, una abajo de la otra. Correr el programa.● Observar la alineación de secuencias. Significado de los

códigos: los residuos en esa columna- son idénticos (*)- se conservan en cuanto a su tipo (:)- tienen características más o menos parecidas (.)

● Descargar el archivo con la alineación (.aln o .clustal_num)

Page 12: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

12

3- Alineación de secuencia

Dinámica Molecular – UNSAM – 2017

Alineación de secuencias:

Page 13: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

13

4- Construcción del modelo

Dinámica Molecular – UNSAM – 2017

● Finalmente hay que unir la secuencia objetivo con las coordenadas de la secuencia molde

● Para ello usar https://swissmodel.expasy.org/ opción “Modelling”, “Alignement Mode”

Copiar o subir acá el archivo con la alineación

Page 14: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

14

4- Construcción del modelo

Dinámica Molecular – UNSAM – 2017

● El sistema básicamente copia las coordenadas atómicas del molde, y estima las de los átomos faltantes.

● Presenta el modelo (estructura de nuestra secuencia objetivo), y algunas medidas de su calidad.

Bajar el pdb, logs, etc

Imaagen interactiva

En color lo que fue modeladoOpciones de color (est. secundaria, calidad, etc)

Page 15: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

15

5- Evaluación del modelo

Dinámica Molecular – UNSAM – 2017

● Swiss-Model evalúa el modelo, pero se puede hacer un chequeo más exhaustivo. Por ejemplo, cargando la estructura pdb del modelo en http://molprobity.biochem.duke.edu/

● Agregando hidrógenos y usando “Analyze all-atom contacts and geometry”:

Modelo manual

Modelo automático(próxima pagina)

MolProbity score (puntaje efectivo)

Page 16: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

16

Opción automática

Dinámica Molecular – UNSAM – 2017

● Swiss-Model puede hacer todo lo anterior (selección del molde, alineación y construcción de la estructura) automáticamente, y proveernos de varios modelos.

● Usar la opción “Modelling”, “myWorkspace” e ingresar la secuencia objetivo.

Page 17: Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos,

17

Refinamiento

Dinámica Molecular – UNSAM – 2017

● Si la evaluación del modelo es mala, se puede repetir el proceso usando otro molde (en este caso, 4ZWJ, que es el que se usa en el proceso automático)

● Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos, rotameros no óptimos, etc.

● RefinamientoRefinamiento: estados de protonación, solvatación, minimización de la energía, equilibración.

● Tampoco es perfecto, ya que la energía (force force fieldfield) es una función empírica (a menos que se haga cuántico).