Bioinformática: fundamentos y aplicaciones de actualidad

36
Bioinformática: Bioinformática: fundamentos y fundamentos y aplicaciones de aplicaciones de actualidad actualidad Fundamentos de Biología Fundamentos de Biología Molecular Molecular Manuel Lemos Ramos Manuel Lemos Ramos Dpto. de Microbiología y Parasitología Dpto. de Microbiología y Parasitología Universidade de Santiago de Compostela Universidade de Santiago de Compostela

description

Bioinformática: fundamentos y aplicaciones de actualidad. Fundamentos de Biología Molecular Manuel Lemos Ramos Dpto. de Microbiología y Parasitología Universidade de Santiago de Compostela. Sequence 2587 BP; 822 A; 575 C; 499 G; 691 T; 0 other; - PowerPoint PPT Presentation

Transcript of Bioinformática: fundamentos y aplicaciones de actualidad

Page 1: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática: fundamentos Bioinformática: fundamentos y aplicaciones de actualidady aplicaciones de actualidad

Fundamentos de Biología MolecularFundamentos de Biología Molecular

Manuel Lemos RamosManuel Lemos RamosDpto. de Microbiología y ParasitologíaDpto. de Microbiología y Parasitología

Universidade de Santiago de CompostelaUniversidade de Santiago de Compostela

Page 2: Bioinformática: fundamentos y aplicaciones de actualidad

BioinformáticaSequence 2587 BP; 822 A; 575 C; 499 G; 691 T; 0 other; tatgtttttt ctgatagtgc acagattgtg tttacccaag cgaaatatgg tgacagcagc 60 ggcatccgtg gtgcagcttg gctaggtttg aactagcaga aagtgattaa agtcacaact 120 ttagtcatcg aaaaattaag taaagcaagt gttttacata ttaaattact gatatttaaa 180 acatacactc ctaattctat ttatatttca catcaacaca caaacacaaa tgatagtaat 240 taccatttag atccaatatc attgcgcaca gcttgaatct gttattgatg aataaggtaa 300 taactcagat gtacactaaa acactactat cagcctccat attgctagcg ctttcccctg 360 cagctctcgc agaagaagtt tctcgattcg atgaggttgt tgtttcggca acgcgaactt 420 ctcaagccat caaaaatacc gccgcttctg ttgctgtcat ttcgagcaaa gacattgaag 480 ccaatatggc aaaagatgtc gcagctatcc ttgaatatac ccctggagtt tcaaccaata 540 gctcatctcg ccaaggtgta cagaccatca atattcgcgg cgtagaaggt aatcgaatca 600 aaatcatggt tgatggagtc acacaaggac aagcattcga cggaggtcct tactcttttg 660 tcaattcgag cgctatcagt atcgatcccg atatggtaaa gagtgttgaa gtcatcaaag 720 gtgcggcgtc aagccttcac ggcagtgatg ccattggtgg tgtcgtcgct tttgacacca 780 aagatcctcg tgatttcctt aaaggagacg caaccacagg cggacaagca aagctttcct 840 actcttcaga agataaatct ttcagtgaac atattgccat tgcaaataga agtggcaatt 900 tagagacctt ggtcgcctat actcgccgtg atgggcaaga gcaacaaaat tttgccgatc 960 gtaaagaaga ttattcgata gagactcaag atagtgcaaa aaatgacttg ctacttaagc 1020 tccaatatca actgagcgat gctcaccgtt tggagttctt tggtgaagca ctgcataaca 1080 aaacagattc tgatatcgct cattccagtt acaaaaacta tcatggtcaa gatacaacga 1140 aacagtatcg ccttggcatc aaacacattt ggctagctga ctctgccatc gcagacacca 1200 tcactagccg agcatcttgg caaagcaaag aagataacgg cttaacgcac cgttttcagc 1260 cagcatcgtc aggaaggcct ccttacactc cagccaatgc ggacaaccaa caaaccaaag 1320 attacttcta taatgaagat aaaattgaat tagaaacgca actggataag ttagttacct 1380 taggtcaaac cgaacataac tttatttatg gtttaagttt tgccagtagc gatatttcaa 1440 ataccaatac agaactcaac tcggatcctg caacgccaaa tcaagttttg gtttatacac 1500 cggatgctac agaccaaaaa atcggcctct ttgttcaaga tgagatcacc cttttgagcg 1560 gtaatttgat tgtcacacca ggccttcgtt atgattcatt tagcaccgat cccggtggta 1620 gcaccacaga acctctcgtt aaatttgacg attcagcact caccagccgt cttggcgcac 1680 tgtaccgtat caataatcaa cattcagtat ttgctcaagt cagccaaggc ttccgtgccc 1740 ctaactttac tgagctgtac tacacgtatg acaacattgc tcaccgttat gtgaacgatc 1800 caaacccata ccttaagtca gaaacaagct tggcctatga attgggttat cgtcacaata 1860 caaacgtctc ggcaactgaa atttctgcat tttatagcga ctatgatgat ttcattgaac 1920 gagttacaac taagaaagtg aacggaataa cccactactc ctatgtcaac ttaagtgaag 1980 cgacgatcaa agggattgaa ttatcaaatc aattaaaatt ggatcaatta attggagccc 2040 cgaatggtat gtcaacacgc ctagcggcaa gttatagcaa aggtgaagat ggtaacggac 2100 gtccattgaa cagcgtaaac ccatggaatg ttgtcgcagc actaaattat gatgatgaaa 2160 gtaccacttg gggtactagc ctgaagttga attatactgc tgcgaagtca gccggtaata 2220 tcaaccgtga ccaacttaat agcggtacag aaaaccaagt tgaactgccg agtgcgacca 2280 ttgtcgatat caccgcttac tttaaaccaa tgcaagatgt cactattact gcgggcatat 2340 ttaacttaac cgacaaagag tactaccgtt ggaatgatat ccgcggtaaa acaaacttag 2400 ataacgacta ctctcaagct gagcgtaact atgctattac cgctaaatat gagttttagc 2460 gattaaacca ttattcacaa agccagcgtt atgctggctt tgttgttcca tgaactcctc 2520 aataaaaaag gctagataac tagccttttc ttacaatgtc caatgtatct tgagcgatta 2580 agattac 2587

Desoxi-riboNucleic Acid(DNA)

Ácido Desoxi-riboNucleico(ADN)

Page 3: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

La estructura del ADNLa estructura del ADN El monómero del ADN es un nucleótido. Los nucleótidos están formados por un azúcar

(desoxi-ribosa), una base nitrogenada y un grupo fosfato.

Los componentes del nucleótido están unidos por fuertes enlaces covalentes.

Las bases son purinas (Guanina y Adenina) y pirimidinas (Citosina y Timina).

La estructura del ADN está formada por 2 cadenas complementarias.

Las 2 cadenas están orientadas en direcciones opuestas, quedando en cada una un extremo 5’ y un extremo 3’.

La unión entre las 2 cadenas se realiza mediante enlaces de hidrógeno entre 2 bases (1 de cada cadena), formando un “par de bases”.

La adenina se une siempre a la timina mediante 2 enlaces. La guanina se une siempre a la citosina mediante 3 enlaces.

Los grupos hidroxilo libres del fosfato son los que dan una fuerte carga eléctrica negativa y el carácter ácido a la molécula

La molécula de ADN se enrrolla en la forma de una doble hélice.

Por cada 10 pares de bases, la molécula gira 360º. La estructura recuerda a una escalera de caracol.

Page 4: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

La estructura del ADNLa estructura del ADN Distintas formas de representación del ADN

La estructura del ADN

Page 5: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Genes y GenomasGenes y Genomas Un Un gengen es un fragmento de ADN que es un fragmento de ADN que

contiene la información necesaria (en forma contiene la información necesaria (en forma de secuencia de bases) para codificar la de secuencia de bases) para codificar la síntesis de una proteína o un ARN. síntesis de una proteína o un ARN. Podemos considerar a un gen como una Podemos considerar a un gen como una unidad de información.unidad de información.

No todo el material genético de un No todo el material genético de un organismo está organizado en genes. Existe organismo está organizado en genes. Existe ADN no codificante. En las células humanas ADN no codificante. En las células humanas solamente el 3% del ADN da lugar a la solamente el 3% del ADN da lugar a la síntesis de proteínassíntesis de proteínas

El El genomagenoma de un organismo es el conjunto de un organismo es el conjunto de material genético que contienen sus de material genético que contienen sus células.células.

Page 6: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Tamaño de las moléculas de ADNTamaño de las moléculas de ADN El virus más pequeño contiene poco más de El virus más pequeño contiene poco más de 4.0004.000 pares de bases. pares de bases.

Una bacteria contiene como media Una bacteria contiene como media 5.105.1066 pares de bases ( pares de bases (5.000 Kb5.000 Kb o o 5 Mb5 Mb) (2 m de longitud).) (2 m de longitud).

Como norma general las bacterias contienen una sola molécula de Como norma general las bacterias contienen una sola molécula de ADN circular, mientras que las células eucarióticas (animales y ADN circular, mientras que las células eucarióticas (animales y vegetales) contienen varias moléculas de ADN lineal organizadas en vegetales) contienen varias moléculas de ADN lineal organizadas en cromosomas.cromosomas.

Una célula humana contiene Una célula humana contiene 3.000 Mb3.000 Mb distribuidas en 46 distribuidas en 46 cromosomas. Cada cromosoma contiene una molécula lineal de cromosomas. Cada cromosoma contiene una molécula lineal de ADN.ADN.

Page 7: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Organización del material genéticoOrganización del material genético El material genético de las células El material genético de las células

eucarióticas se organiza en eucarióticas se organiza en cromosomas. Cada uno está formado cromosomas. Cada uno está formado por una mólecula de ADN en doble por una mólecula de ADN en doble hélice lineal asociado a proteínas hélice lineal asociado a proteínas básicas (histonas).básicas (histonas).

El material genético de las células El material genético de las células procarióticas se organiza habitualmente procarióticas se organiza habitualmente en 1 sólo cromosoma que contiene una en 1 sólo cromosoma que contiene una molécula de ADN circular.molécula de ADN circular.

Estructura del cromosoma Mitosis

Page 8: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Estructura del ARNEstructura del ARN El ARN (El ARN (áácido cido rriboibonnucleico) contiene ucleico) contiene

ribosaribosa en lugar de desoxi-ribosa. en lugar de desoxi-ribosa. Está formado por las Está formado por las mismas basesmismas bases

nitrogenadas, nitrogenadas, excepto la Timinaexcepto la Timina que que se sustituye por se sustituye por UUracilo.racilo.

El El UUracilo es también complementario racilo es también complementario de la de la AAdenina.denina.

A diferencia del ADN está formado por A diferencia del ADN está formado por una una única cadenaúnica cadena de nucleótidos. de nucleótidos.

La longitud de la cadena es mucho La longitud de la cadena es mucho menor que en el ADN.menor que en el ADN.

Se pueden formar Se pueden formar enlaces entre enlaces entre basesbases complementarias complementarias dentro de la dentro de la misma cadenamisma cadena, lo que origina , lo que origina estructuras tridimensionales complejas.estructuras tridimensionales complejas.

Page 9: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Tipos de ARNTipos de ARNTIPOTIPO ABUN-ABUN-

DANCIADANCIANº BASESNº BASES FUNCIONFUNCION

ARNrARNrRibosómicoRibosómico

80%80% 120-120-35003500

Estructura de Estructura de los ribosomaslos ribosomas

ARNtARNtTransferenciaTransferencia

15%15% 7575 Transporte de Transporte de aminoácidosaminoácidos

ARNmARNmMensajeroMensajero

5%5% variablevariable Síntesis de Síntesis de proteínasproteínas

Page 10: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

De los genes a las proteínasDe los genes a las proteínas

ADN

Replicación

ARNTranscripción

ProteínasTraducción

Transcripción inversa(retrovirus)

Dogma Central de la Biología MolecularFlujo de la información genética

Page 11: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

De los genes a las proteínasDe los genes a las proteínas

Page 12: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

La replicación del ADNLa replicación del ADN

Page 13: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Replicación del ADNReplicación del ADN Catalizada por una ADN-

polimerasa que añade nucleótidos al extremo 3’-OH de la cadena naciente.

La ADN-polimerasa necesita un cebador de ARN.

Los nucleótidos se añaden por emparejamiento complementario con las bases de la cadena molde.

Los sustratos, desoxi-ribonucleótido trifosfato (dNTP) se hidrolizan al añadirse, liberando energía para la síntesis del ADN.

Existen diversas proteínas que colaboran en la replicación.

DNA pol

ARN cebador

Page 14: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

TranscripciónTranscripción

La síntesis del ARNm la La síntesis del ARNm la realiza una ARN polimerasa realiza una ARN polimerasa en dirección 5’--> 3’.en dirección 5’--> 3’.

Los ribonucleótidos se Los ribonucleótidos se añaden por emparejamiento añaden por emparejamiento complementario con las complementario con las bases de la cadena molde de bases de la cadena molde de ADN.ADN.

La presencia de La presencia de AAdenina en denina en el ADN determina la adición el ADN determina la adición de un de un UUracilo en el ARN.racilo en el ARN.

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 15: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

La transcripción en procariotasLa transcripción en procariotas Los genes que codifican proteínas involucradas en la

misma ruta metabólica suelen presentarse agrupados en el cromosoma, formando operones, lo que permite la expresión coordinada.

Una región reguladora adyacente al operón, determina su transcripción- es el “operador”.

Proteínas reguladoras funcionan con los operadores, para controlar la transcripción de los genes.

Page 16: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Propiedades de los promotoresPropiedades de los promotores• Los Promotores son regiones de aprox. 40 bp localizados en el

extremo -5' del punto de inicio de la transcripción.• Existen 2 elementos de secuencia consenso:

• La “región -35”, con consenso TTGACA – (unión de la subunidad sigma?) • La “región -10” (Pribnow box ), con consenso TATAAT (región ideal para la

apertura de la doble hebra).

Page 17: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

TranscripciónTranscripción Terminación asistida por

factores proteicos ()

Secuencias específicas: sitios de terminación en el DNA – Repeticiones invertidas

(palíndromos), ricos en G:C, que forman una estructura de lazo en el RNA

– 6-8 A en DNA, que producen U en el RNA

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 18: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Transcripción en eucariotasTranscripción en eucariotas La Cromatina limita el acceso de las proteínas reguladoras a los promotores. Existen factores proteicos que deben reorganizar la cromatina. Las RNA polimerasas I, II y III transcriben rRNA, mRNA y tRNA,

respectivamente. Las 3 polimerasas interaccionan con los promotores a través de los “factores

de transcripción”. La “TATA box” (TATAAA) es un promotor “consenso”. Los factores de transcripción reconocen secuencias promotoras específicas e

inician la transcripción (algunos factores se unen a secuencias específicas en la región codificante del gen).

Además de promotores, los genes eucariotas tienen “enhancers”, o “upstream activation sequences”.

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 19: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Estructura del gen eucariotaEstructura del gen eucariota Los genes eucariotas están

divididos en exones (se traducen a aminoácidos) e intrones (no codificantes).

Ejemplos: El gen de la actina tiene un intrón de 309-pb que separa los primeros 3 aminoácidos de los restantes 350.

El gen del colágeno pro-alpha-2 del pollo, mide 40-kb, con 51 exones que suman sólo 5 kb.

Los exones suelen medir entre 45 y 249 bases.

El mecanismo por el que se escinden los intrones y por el que se unen los exones, es complejo y muy preciso (“RNA- splicing”)

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 20: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Estructura del gen eucariotaEstructura del gen eucariota

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 21: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Traducción del mensaje genéticoTraducción del mensaje genético La información contenida en la secuencia de bases del ADN es La información contenida en la secuencia de bases del ADN es

trasladada o traducida a una secuencia de aminoácidos en una trasladada o traducida a una secuencia de aminoácidos en una proteína, a través del ARN que actúa como intermediarioproteína, a través del ARN que actúa como intermediario

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 22: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Las proteínasLas proteínas

AlaninaAlanina AlaAla AA

ArgininaArginina ArgArg RR

AsparraginaAsparragina AsnAsn NN

AspárticoAspártico AspAsp DD

CisteínaCisteína CysCys CC

FenilalaninaFenilalanina PhePhe FF

GlicinaGlicina GlyGly GG

GlutámicoGlutámico GluGlu EE

GlutaminaGlutamina GlnGln QQ

HistidinaHistidina HisHis HH

IsoleucinaIsoleucina IleIle II

LeucinaLeucina LeuLeu LL

LisinaLisina LysLys KK

MetioninaMetionina MetMet MM

ProlinaProlina ProPro PP

SerinaSerina SerSer SS

TirosinaTirosina TyrTyr YY

TreoninaTreonina ThrThr TT

TriptófanoTriptófano TrpTrp WW

ValinaValina ValVal VV

Aminoácidos esenciales que forman las proteínas

Page 23: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Síntesis de proteínasSíntesis de proteínasSequence 2587 BP; 822 A; 575 C; 499 G; 691 T; 0 other; tatgtttttt ctgatagtgc acagattgtg tttacccaag cgaaatatgg tgacagcagc 60 ggcatccgtg gtgcagcttg gctaggtttg aactagcaga aagtgattaa agtcacaact 120 ttagtcatcg aaaaattaag taaagcaagt gttttacata ttaaattact gatatttaaa 180 acatacactc ctaattctat ttatatttca catcaacaca caaacacaaa tgatagtaat 240 taccatttag atccaatatc attgcgcaca gcttgaatct gttattgatg aataaggtaa 300 taactcagat gtacactaaa acactactat cagcctccat attgctagcg ctttcccctg 360 cagctctcgc agaagaagtt tctcgattcg atgaggttgt tgtttcggca acgcgaactt 420 ctcaagccat caaaaatacc gccgcttctg ttgctgtcat ttcgagcaaa gacattgaag 480 ccaatatggc aaaagatgtc gcagctatcc ttgaatatac ccctggagtt tcaaccaata 540 gctcatctcg ccaaggtgta cagaccatca atattcgcgg cgtagaaggt aatcgaatca 600 aaatcatggt tgatggagtc acacaaggac aagcattcga cggaggtcct tactcttttg 660 tcaattcgag cgctatcagt atcgatcccg atatggtaaa gagtgttgaa gtcatcaaag 720 gtgcggcgtc aagccttcac ggcagtgatg ccattggtgg tgtcgtcgct tttgacacca 780 aagatcctcg tgatttcctt aaaggagacg caaccacagg cggacaagca aagctttcct 840 actcttcaga agataaatct ttcagtgaac atattgccat tgcaaataga agtggcaatt 900 tagagacctt ggtcgcctat actcgccgtg atgggcaaga gcaacaaaat tttgccgatc 960 gtaaagaaga ttattcgata gagactcaag atagtgcaaa aaatgacttg ctacttaagc 1020 tccaatatca actgagcgat gctcaccgtt tggagttctt tggtgaagca ctgcataaca 1080 aaacagattc tgatatcgct cattccagtt acaaaaacta tcatggtcaa gatacaacga 1140 aacagtatcg ccttggcatc aaacacattt ggctagctga ctctgccatc gcagacacca 1200 tcactagccg agcatcttgg caaagcaaag aagataacgg cttaacgcac cgttttcagc 1260 cagcatcgtc aggaaggcct ccttacactc cagccaatgc ggacaaccaa caaaccaaag 1320 attacttcta taatgaagat aaaattgaat tagaaacgca actggataag ttagttacct 1380 taggtcaaac cgaacataac tttatttatg gtttaagttt tgccagtagc gatatttcaa 1440 ataccaatac agaactcaac tcggatcctg caacgccaaa tcaagttttg gtttatacac 1500 cggatgctac agaccaaaaa atcggcctct ttgttcaaga tgagatcacc cttttgagcg 1560 gtaatttgat tgtcacacca ggccttcgtt atgattcatt tagcaccgat cccggtggta 1620 gcaccacaga acctctcgtt aaatttgacg attcagcact caccagccgt cttggcgcac 1680 tgtaccgtat caataatcaa cattcagtat ttgctcaagt cagccaaggc ttccgtgccc 1740 ctaactttac tgagctgtac tacacgtatg acaacattgc tcaccgttat gtgaacgatc 1800 caaacccata ccttaagtca gaaacaagct tggcctatga attgggttat cgtcacaata 1860 caaacgtctc ggcaactgaa atttctgcat tttatagcga ctatgatgat ttcattgaac 1920 gagttacaac taagaaagtg aacggaataa cccactactc ctatgtcaac ttaagtgaag 1980 cgacgatcaa agggattgaa ttatcaaatc aattaaaatt ggatcaatta attggagccc 2040 cgaatggtat gtcaacacgc ctagcggcaa gttatagcaa aggtgaagat ggtaacggac 2100 gtccattgaa cagcgtaaac ccatggaatg ttgtcgcagc actaaattat gatgatgaaa 2160 gtaccacttg gggtactagc ctgaagttga attatactgc tgcgaagtca gccggtaata 2220 tcaaccgtga ccaacttaat agcggtacag aaaaccaagt tgaactgccg agtgcgacca 2280 ttgtcgatat caccgcttac tttaaaccaa tgcaagatgt cactattact gcgggcatat 2340 ttaacttaac cgacaaagag tactaccgtt ggaatgatat ccgcggtaaa acaaacttag 2400 ataacgacta ctctcaagct gagcgtaact atgctattac cgctaaatat gagttttagc 2460 gattaaacca ttattcacaa agccagcgtt atgctggctt tgttgttcca tgaactcctc 2520 aataaaaaag gctagataac tagccttttc ttacaatgtc caatgtatct tgagcgatta 2580 agattac 2587

Page 24: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Síntesis de proteínasSíntesis de proteínas/product="HuvA protein"

/protein_id="CAC28362.1" /db_xref="GI:12697532" /db_xref="GOA:Q9AJS1" /db_xref="SPTREMBL:Q9AJS1" /translation="MYTKTLLSASILLALSPAALAEEVSRFDEVVVSATRTSQAIKNT AASVAVISSKDIEANMAKDVAAILEYTPGVSTNSSSRQGVQTINIRGVEGNRIKIMVD GVTQGQAFDGGPYSFVNSSAISIDPDMVKSVEVIKGAASSLHGSDAIGGVVAFDTKDP RDFLKGDATTGGQAKLSYSSEDKSFSEHIAIANRSGNLETLVAYTRRDGQEQQNFADR KEDYSIETQDSAKNDLLLKLQYQLSDAHRLEFFGEALHNKTDSDIAHSSYKNYHGQDT TKQYRLGIKHIWLADSAIADTITSRASWQSKEDNGLTHRFQPASSGRPPYTPANADNQ QTKDYFYNEDKIELETQLDKLVTLGQTEHNFIYGLSFASSDISNTNTELNSDPATPNQ VLVYTPDATDQKIGLFVQDEITLLSGNLIVTPGLRYDSFSTDPGGSTTEPLVKFDDSA LTSRLGALYRINNQHSVFAQVSQGFRAPNFTELYYTYDNIAHRYVNDPNPYLKSETSL AYELGYRHNTNVSATEISAFYSDYDDFIERVTTKKVNGITHYSYVNLSEATIKGIELS NQLKLDQLIGAPNGMSTRLAASYSKGEDGNGRPLNSVNPWNVVAALNYDDESTTWGTS LKLNYTAAKSAGNINRDQLNSGTENQVELPSATIVDITAYFKPMQDVTITAGIFNLTD KEYYRWNDIRGKTNLDNDYSQAERNYAITAKYEF"

Page 25: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Page 26: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Síntesis de proteínasSíntesis de proteínas La síntesis transcurre desde La síntesis transcurre desde

el extremo N-terminal al el extremo N-terminal al extremo C-terminal.extremo C-terminal.

Los ribosomas leen el ARNm Los ribosomas leen el ARNm en la dirección 5’--3’.en la dirección 5’--3’.

La traducción tiene lugar en La traducción tiene lugar en polirribosomas o polisomas. polirribosomas o polisomas. Hay más de un ribosoma Hay más de un ribosoma traduciendo cada ARNm traduciendo cada ARNm simultáneamente.simultáneamente.

La elongación de la cadena La elongación de la cadena proteica tiene lugar por proteica tiene lugar por adición secuencial de adición secuencial de aminoácidos al extremo C-aminoácidos al extremo C-terminal.terminal.

Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing

Page 27: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

El código genéticoEl código genético Cada aminoácido está codificado Cada aminoácido está codificado

por una secuencia de por una secuencia de 3 3 nucleótidosnucleótidos en el ARNm llamada en el ARNm llamada codón.codón.

Las combinaciones de las 4 bases Las combinaciones de las 4 bases tomadas de 3 en 3 originan tomadas de 3 en 3 originan 6464 posibles permutaciones.posibles permutaciones.

Puesto que solamente existen Puesto que solamente existen 20 20 aminoácidosaminoácidos formando parte de formando parte de las proteínas, el código es las proteínas, el código es redundante: existen redundante: existen codones codones sinónimossinónimos..

Existe además un Existe además un codóncodón que que marca el marca el inicioinicio de una proteína y de una proteína y 3 codones que marcan el 3 codones que marcan el finfin..

Page 28: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Síntesis de proteínasSíntesis de proteínasInitiation

Page 29: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

El código genéticoEl código genético

3 N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C2 N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C

-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N -3 C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N

pautas de lectura(ORF’s)

pautas de lectura(ORF’s)

DNA 5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’

sentido de lectura para la secuencia de la cadena superior

sentido de lectura para la secuencia de la cadena inferior

Page 30: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

El código genéticoEl código genético

3 N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C2 N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C

-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N -3 C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N

pautas de lectura(ORF’s)

pautas de lectura(ORF’s)

DNA 5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’

sentido de lectura para la secuencia de la cadena superior

sentido de lectura para la secuencia de la cadena inferior

Page 31: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

El código genéticoEl código genético

3 N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C2 N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C

-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N -3 C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N

pautas de lectura(ORF’s)

pautas de lectura(ORF’s)

DNA 5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’

sentido de lectura para la secuencia de la cadena superior

sentido de lectura para la secuencia de la cadena inferior

Page 32: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

MutacionesMutaciones

Page 33: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Variabilidad genéticaVariabilidad genética Los SNPs o “polimorfismos de Los SNPs o “polimorfismos de

nucleótido único” son variaciones de nucleótido único” son variaciones de la secuencia de bases de una región la secuencia de bases de una región del genoma, que afectan a un único del genoma, que afectan a un único nucleótido.nucleótido.

Para ser considerado un SNP debe Para ser considerado un SNP debe ocurrir en al menos un 1% de la ocurrir en al menos un 1% de la población.población.

Los SNPs proporcionan el 90% de la Los SNPs proporcionan el 90% de la variación genética humana y ocurren variación genética humana y ocurren cada 100 o 300 bases a lo largo de cada 100 o 300 bases a lo largo de todo el genoma (tanto en regiones todo el genoma (tanto en regiones codificantes como no codificantes).codificantes como no codificantes).

2 de cada 3 SNPs corresponden a la 2 de cada 3 SNPs corresponden a la sustitución de C por T.sustitución de C por T.

Una gran parte no tienen efecto Una gran parte no tienen efecto alguno sobre las funciones celulares, alguno sobre las funciones celulares, pero algunos pueden producir pero algunos pueden producir alteraciones o cambios diversos.alteraciones o cambios diversos.

Page 34: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Variabilidad genética: SNPs y Variabilidad genética: SNPs y HaplotiposHaplotipos

Un haplotipo es un bloque de Un haplotipo es un bloque de ADN en un cromosoma que ADN en un cromosoma que contiene un determinado contiene un determinado número de SNPs. El número de SNPs. El haplotipo es el patrón de haplotipo es el patrón de SNPs en ese bloque.SNPs en ese bloque.

Cada haplotipo contiene SNPs característicos.Cada haplotipo contiene SNPs característicos.

Mapa de Haplotipos (Hap Map): mapa de los haplotipos y los Mapa de Haplotipos (Hap Map): mapa de los haplotipos y los SNPs que los caracterizan.SNPs que los caracterizan.

Permitirá la identificación de genes y variaciones que a Permitirá la identificación de genes y variaciones que a afectan a la salud humana.afectan a la salud humana.

Page 35: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Variabilidad genéticaVariabilidad genética La variación de la secuencia de bases en un gen determinado puede La variación de la secuencia de bases en un gen determinado puede

cambiar la proteína codificada por ese gen.cambiar la proteína codificada por ese gen.

Page 36: Bioinformática: fundamentos y aplicaciones de actualidad

Bioinformática

Variabilidad genética: alelosVariabilidad genética: alelos