Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos...
Transcript of Dinámica Molecular de Proteínas Modelado y Simulación ... · Los modelos, aún con buenos...
Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional
Profesores: Eliana K. Asciutto & Ignacio J. General2do cuatrimestre 2017
Escuela de Ciencia y TecnologíaUNSAM
Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional
Modelado homólogoModelado homólogo
3
Modelado Homólogo
Dinámica Molecular – UNSAM – 2017
Proteínas con secuencias similares tienen estructuras similares
LT G
GD
E
L T C G D D
Secuencia objetivo: LTCGDDSecuencia molde: LTGGDE
● Secuencia sin estructura conocida (objetivo):
● Busco una secuencia similar, con estructura conocida (molde):
● Copio la estructura:
● Refino la estructura:
LT
GD
CD
LT C G
D D
Secuencia modelada
4
Modelado Homólogo
Dinámica Molecular – UNSAM – 2017
Proteínas con secuencias similares tienen estructuras similares
Figura de Sander and Schneider (1991) Proteins 9:56-68:
La región segura región segura para modelado homólogo es la de arriba a la derecha.
Como regla general, no usar secuencias con identidad < 40%.
5
Modelado Homólogo
Dinámica Molecular – UNSAM – 2017
Pero...¡puede fallar!¡puede fallar!
Región amarilla: longitud de 80 aa, identidad > 40%Estructuras muy diferentesEstructuras muy diferentes
Cápside viral (1PIV) Glicosiltransferasa (1HMP)
6
Modelado Homólogo
Dinámica Molecular – UNSAM – 2017
¿Por qué usar modelado homólogo?
● Hay > 100,000 estructuras en el PDB. Pero existen millones de secuencias. No siempre se tiene la estructura de interés
● Es mucho mas fácil que medir la estructura experimentalmente
● Sirve para estudiar algunas secuencias, a veces cualitativamente, a veces cuantitativamente.
● Se puede usar para predecir efectos de mutación, regiones de ligamiento, estabilidad, etc.
7
Rodopsina Humana
Dinámica Molecular – UNSAM – 2017
Es una proteína transmembrana, foto-sensible, envuelta en la foto-transducción que inicia la visión humana.
¿Cómo hacer un modelo de Rodopsina?
By Dpryan at English Wikipedia (Transferred from en.wikipedia to Commons.) [Public domain], via Wikimedia Commons
Bicapa lipídicaRodopsina (GPCR)
Proteína G
8
1- Secuencia de la Rodopsina (objetivo)
Dinámica Molecular – UNSAM – 2017
● Obtener la secuencia de la Rodopsina Humana, por ejemplo, en la base de datos http://www.uniprot.org/
● Elegir la opción P08100. Allí se describen las características conocidas de Rodopsina humana.
● Buscar la secuencia (o cliquear a la izquierda “secuencia”)● Bajar la secuencia en formato FASTA:>sp|P08100|OPSD_HUMAN Rhodopsin OS=Homo sapiens GN=RHO PE=1 SV=1MNGTEGPNFYVPFSNATGVVRSPFEYPQYYLAEPWQFSMLAAYMFLLIVLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVLGGFTSTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLAGWSRYIPEGLQCSCGIDYYTLKPEVNNESFVIYMFVVHFTIPMIIIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWVPYASVAFYIFTHQGSNFGPIFMTIPAFFAKSAAIYNPVIYIMMNKQFRNCMLTTICCGKNPLGDDEASATVSKTETSQVAPA
9
2- Selección del molde
Dinámica Molecular – UNSAM – 2017
● La herramienta BLAST (Basic Local Alignment Search Tool), permite comparar una secuencia objetivo contra una base de datos.
● Hay muchas opciones:http://uniprot.org (website anterior)https://toolkit.tuebingen.mpg.de/#/tools/hhpred https://blast.ncbi.nlm.nih.gov/Blast.cgi Usemos https://blast.ncbi.nlm.nih.gov/Blast.cgi, seleccionando comparación contra el Protein Data Bank
● El sistema devuelve una lista de varias secuencias con ‘puntajes’: E-value (cuanto menor, mejor, <<1), porcentaje de similaridad, etc.
● Los puntajes son peores si hay indels (insertions/deletions), inserciones o vacíos en una de las dos secuencias comparadas.
10
2- Selección del molde
Dinámica Molecular – UNSAM – 2017
● Usar secuencias solo con E < 1 y/o identidad > 40%.● Cualquiera de ellas? No, examinar las estructuras 3D, y
verificar que tengan buena resolución (1 o 2 Å), y pocos átomos faltantes.
● Una vez seleccionado el “mejor”, anotar el campo en la columna “Accession” (usar 1JFP_A, aunque no es el mejor); ese es el código PDB de la estructura. Cliquear ahí, y vamos a poder ver la secuencia en formato FASTA.
>1JFP:A|PDBID|CHAIN|SEQUENCEMNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA
11
3- Alineación de secuencia
Dinámica Molecular – UNSAM – 2017
● Necesitamos ahora generar una alineación de las secuencias objetivo y molde.
● http://www.ebi.ac.uk/Tools/msa/clustalo/ ● Entrar las secuencias en formato FASTA de las secuencias
objetivo y molde, una abajo de la otra. Correr el programa.● Observar la alineación de secuencias. Significado de los
códigos: los residuos en esa columna- son idénticos (*)- se conservan en cuanto a su tipo (:)- tienen características más o menos parecidas (.)
● Descargar el archivo con la alineación (.aln o .clustal_num)
12
3- Alineación de secuencia
Dinámica Molecular – UNSAM – 2017
Alineación de secuencias:
13
4- Construcción del modelo
Dinámica Molecular – UNSAM – 2017
● Finalmente hay que unir la secuencia objetivo con las coordenadas de la secuencia molde
● Para ello usar https://swissmodel.expasy.org/ opción “Modelling”, “Alignement Mode”
Copiar o subir acá el archivo con la alineación
14
4- Construcción del modelo
Dinámica Molecular – UNSAM – 2017
● El sistema básicamente copia las coordenadas atómicas del molde, y estima las de los átomos faltantes.
● Presenta el modelo (estructura de nuestra secuencia objetivo), y algunas medidas de su calidad.
Bajar el pdb, logs, etc
Imaagen interactiva
En color lo que fue modeladoOpciones de color (est. secundaria, calidad, etc)
15
5- Evaluación del modelo
Dinámica Molecular – UNSAM – 2017
● Swiss-Model evalúa el modelo, pero se puede hacer un chequeo más exhaustivo. Por ejemplo, cargando la estructura pdb del modelo en http://molprobity.biochem.duke.edu/
● Agregando hidrógenos y usando “Analyze all-atom contacts and geometry”:
Modelo manual
Modelo automático(próxima pagina)
MolProbity score (puntaje efectivo)
16
Opción automática
Dinámica Molecular – UNSAM – 2017
● Swiss-Model puede hacer todo lo anterior (selección del molde, alineación y construcción de la estructura) automáticamente, y proveernos de varios modelos.
● Usar la opción “Modelling”, “myWorkspace” e ingresar la secuencia objetivo.
17
Refinamiento
Dinámica Molecular – UNSAM – 2017
● Si la evaluación del modelo es mala, se puede repetir el proceso usando otro molde (en este caso, 4ZWJ, que es el que se usa en el proceso automático)
● Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos, rotameros no óptimos, etc.
● RefinamientoRefinamiento: estados de protonación, solvatación, minimización de la energía, equilibración.
● Tampoco es perfecto, ya que la energía (force force fieldfield) es una función empírica (a menos que se haga cuántico).