Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif.UnidaddeBiologaMolecular.InstitutPasteurMontevideo.
1. Unpocodehistoria2. SecuenciacinpormtododeMaxxamyGilbert3. SecuenciacinpormtododeSanger
a. AvancesenelmtododeSanger(19861996)b. ProyectoGenomaHumano
4. AlgunosMtodosdesecuenciadomasivoa. Pirosecuenciacinb. Secuenciadoporhibridizacin(Illumina)c. Otromtodosd. Aplicaciones
1. Unpocodehistoria.
Pasaron15aosdesdeeldescubrimientode laestructuradedoblehlicedelADNen1953hastaladeterminacindelaprimerasecuenciadeADNdeformaexperimental.Algunasdelasrazonesqueprovocaronestademorafueron:
1. LaspropiedadesqumicassimilaresdelasdiferentesmolculasdeADNdificultabansuaislamiento.
2. EllargodelasmolculasdeADN,muchomayoresquelascadenaspolipeptdicasdelasprotenas,hacaninabordablelasecuenciacincompleta.
3. NoseconocanADNasasespecficas.Lasecuenciacindeprotenassebasabaenelusodeproteasasquecortabanendeterminadosaminocidos.
Sin embargo, algunas molculas de ARN no ofrecan estas dificultades, en particular lasmolculas de ARN de transferencia eran pequeas y se podan purificar individualmente.Adems se conocan ARNasas baseespecficas y se desarrollaron mtodos anlogos a losutilizadosparaprotenas.LaprimersecuenciadeuncidonucleicofueobtenidaporHolleyysuscolaboradoresen1965ycorrespondaalARNde transferenciadealaninadeEscherichiacoli.Un evento importante en el desarrollo de los mtodos de secuenciacin de ADN fue eldescubrimientode lasenzimasde restriccinde tipo IIen1970.Estsenzimas reconocenycortanelADNensecuenciasespecficas(engeneralentre4y6basesdelargo).Estasenzimasproporcionaronunmtodo generalpara fragmentar largasmolculasdeADN enpequeaspiezas para luego ser separadas por electroforesis en geles de agarosa. Amediados de ladcadadel70,FrederickSangerpublicaelmtodomsmenos (plusminusmethod)quepermita la secuenciacinde fragmentosdeADNutilizando laenzimaADNpolimerasadeE.coli. A fines de estamisma dcada,Maxxam y Gilbert publican unmtodo alternativo desecuenciacindeADN(mtodoqumico)yelmismoFrederickSangerpublicaelmtodoqueluegoseconvertiraenelmsutilizadodurante lossiguientes30aos (mtodoenzimtico),comoveremosenelpunto3.
2
El mfebrepubli
En eparadeuncadadesdepoliacdeesEl mpoliacADN.
2. Secuenci
todo de seero de 1977caraelmtoelartculodesecuenciarunADNmarcunade lasbe el extremcrilamidaysstamolculatodo propcrilamida,y
acinqumicecuenciacinen el Volu
ododesecueescribenelpunamolculcado radioacbases.Elcormo marcadoseparandod.puesto estabenesteprim
ca.n qumica pmen 74 (nenciacinenzrocedimientladeADN.Etivamenteerteparcialdo hasta laichosfragme
ba limitadomerartculo
Elqu(18dimestpHinteelproy thidtim
Endur(mo
FigupoIntUntenqueposcolsl
Mto
propuesto po2) de la re
zimticaquetodeestamElprocedimienunextremecadabasebase dndeentosporta
por la capmuestran la
mtodoutilimica produ8M hidracinametilsulfatoetratamientneutro, entensoparalascontrario, eovocaunpattenues dedracina)prodminas.laFigura1,rante la secuostradoene
ura 1. Se mliacrilamida cerpretacin:a banda intenueenlasegue lasituacinsicin. Una bumna en laopresenteen
odosdesecu
or Maxxamevista PNAS,everemosenmanera:Desentodetermmo,cortndoe,generaune fueron cmao,espo
pacidad deaposibilidad
izaba4reaccuce cortes ea, 2M NaClcortaenAdetoqumicostonces se osguaninasyel tratamientrninversoguaninas). Educeelclivaj
semuestraeuenciacindelartculode
muestran loscon cada unaLa secuenciaensa en la pundacorrespo inversacorrebanda que apmisma posicinlaltimacol
enciacinde
y Gilbert, f10meses a
nlasiguientearrollamosumina lasecueoloconagensetde fragmlivados. Utiosibledeterm
resolucinddesecuen
cionesqumiespecficame. Una reacceninasyGuaecalientalaobtiene un ptenuesparanto posterio(bandasinteEl ltimo tjetantoenc
elpatrndedeun fragm1977).
cuatro cara de las reacse lee de a
primera columondenaunaAespondeaunparece en lan indica unumnacorresp
ecidosnuclGonzalo
fue publicadantes que Seseccin.unanuevatencianucleontesqumicomentosmarlizando geleminarlasecu
de los geleciar100bas
icas.Unareaente en Citocin con 50aninas;siluereaccina9patrn de balasadeninar a un pHensasdeaderatamientocitosinascom
ebandasobtentode64
rriles del gecciones de clibajo hacia armna y una bAdenina,mienaGuaninaentercera y cua C. y una bpondeaunaT
leicos.oGreif
2
do enSanger
cnicaotdicaosenrcadoses deuencia
es desesde
accinosinas0 mMegode90Caandasas.Porcidoeninas(18Mmoen
tenidobases
l deivaje.rriba.andantrasnesauartaandaT.
Fred
Fuequeprot(195
En1dnResocomunaobtu(m
En1losc
En1Fuen
Lectu
3
Endicmtohabapartirdificusecuemto
As, esecueaspeccapila(finalpremlaapcidoprinclosse
derickSange
elaprimerap lasprotenastenas deber58).
1962,Sangercnde Francis Colvercomoomoestudiando tcnicaaplicuvo por ellotododesecue
1992,elWellccentrosdesec
1985seretirntes:http://www.
urasrecomendad
3. Secuenci
ciembrede1odoparadetan ya publicrdelcualhaultad en la iencia hicieroodosdesecuelmtodo penciacin dectostecnolar, etc.) perizado en el
mioNobelenaricindeloosnucleicos.ipiodenuclecuenciadore
er(1918)Frederick Saesperabaquedecidi realirealizandouncontinutrabel transcursoordenanlosa
personaenobseranmolcuan tenerun
comienzaatrrick, John Kebtenerlasecuoprimero la fcable luegoalsu segundoenciacinqu
comeTrustycuenciacind
ysededicap.dnaftb.org/23/b
das:NobelLectu
acinenzim1977sepubterminar lascado dos aabanlogradonterpretacion que Sangenciacindepropuesto pe cidos nucgicosymetormitieron, cao 2003)Qumicapo
ossecuenciaAunas,muetidos termesdeIllumin
nger naci eneFredsiguierizar una carrnPh.D.conAbajandoconCo de la inveaminocidose
btenerlasecuulasordenadaordeno secu
rabajarenellendrew y otrouenciadeADformadeseclADN (elmtpremio Nobmica)yPaulB
elMedicalRdndesellev
principalmente
io.html/http://wre(FrederickSan
tica.licaeltrabajsecuenciasdos antes, unoobtenerdon de los reger y sus coecidosnuclor Sanger ecleicos hastaodolgicos(aomo hito fupor estemrlainvencidores454sechasdelasnminadores,dna.
Mto
n Rendcomberasuspasos,sera en CiencAlbertNeuberC.Chibnallidestigacin, Saenlaprotena
enciadeaminasy,poranauencia. Por es
aboratoriodeos trabajabanNeralaextenuenciarARNtodode secuel tambin eBerg(ADNrec
esearchCounadelanteelp
ealcuidadodwww.sanger.ac.uk
ger,1980).
odeSanger,debasesennmtodo dossecuenciasultados y aolaboradoreeicos.en 1977 se ca la actualidautomatizacundamental,todo. En 19ndeestemediouncamnuevastecnodescritopor
odosdesecu
e, Inglaterra esinembargoecias. Continuger,enmetabentificandolosnger imagina.
nocidosdeuloga, losgenste trabajoo
eBiologaMon con problemnsinnatural(unamolculenciacinporen Qumica ccombinante).
ncilestablecieproyectoGeno
desujardn.k/about/people/
,NicklenyCounamolcude secuenciaasde70basealgunos erros siguieran
convirti endad. La incoin,mtodo, la secuenc980 Frederictodo(verrembioenlateologasdeseSanger,com
enciacinde
en 1918.DeenlaUniversi su formacibolismodeamsaminocidos las formas
unaprotena(nesyelADNbtuvo suprim
lecular,tambmas relacionadesutrabajolamspequerdideoxinuclecompartido co
eronelSangeromaHumano
biographies/fsan
oulsonquepladeADN. acin (mtodesdelbacteores que podtrabajando
elmtodorporacin dosdedetecciciacin delck Sangerobecuadro).Reecnologadeecuenciacinmoveremos
ecidosnuclGonzalo
padremdicdaddeCambn en Cambminocidos.Lsdelainsulinen las cule
(lainsulina).PquecodificamerpremioN
inenCambrados con el Aoanterior.Fueea) logrobtetidos).En1on Walter Gi
r Institute,un.
nger.html
proponeunnSangeryCodomsmenrifagoX1dan ocurrirpara mejora
ms utilizademejoras ein,electrofgenoma hubtuvo su segecinen2005secuenciacimasivautilimsadelan
leicos.oGreif
3
o, seridgeridgeLuegona,enes se
ProbestasNobel
ridge,ADN.eas,tener1980,ilbert
node
nuevooulsonnos) a74.Laen laar los
do deen losforesismanogundo5,conndezanelnteen
ElmcadendideoFiguADN(Figu
Enelreaccextendebepresetrifos
Figura2
Figura3naciente
todo enzimna de ADNoxinucletidoura2).Lainimpide quera3).
artculoejecin:Debidondindose,erahaberseencia de unasfato (uno
2.Estructurade
.Esquemademeluegodelainc
mtico de Saque est sios(esdecirncorporacine una nueva
emplifican,doaqueeldentonces la tincorporadoamezcla dede ellos m
unnucletido
mecanismodescorporacinde
anger, utilizaendo sintetnucletidosdeunabasea base pued
de forma cladTnocontieterminacin.Siuncebade ddTTP yarcado radi
(ej.dATP)yun
sntesisdeADNeundidoxinucle
Mto
a una ADN pizada en lugqueensucaeconestasca incorporas
ara,que sucenegrupo3ocurreespedoryunmoldTTP, as coiactivamente
dideoxinucle
N(1),y(2)impoetido.
odosdesecu
polimerasa egares especarbono3nocaractersticase y la snte
ede cundohidroxilo, lecficamenteldesonincubomo los otre con 32p),
tido(ddATP).
osibilidaddeco
enciacinde
e inhibidoreficos, particocontienenasenunmolesis de ADN
utilizandidacadenanoeen lasposbadosconAros tres deo, se obtien
ntinuarelongac
ecidosnuclGonzalo
s que finalizcularmenteelgrupohidlculanacienN es interrum
deoxiTiminaopuedecontsicionesdnDNpolimeraoxiribonucleoe un mezc
cindecadena
leicos.oGreif
4
zan lautilizadroxilontedempida
en latinuardedTasaenosidoscla de
a
fragmesframuesparamezcsecue
Lasse
Figuraprincip
mentostodosaccionadapostra ladistribcada uno d
claenparaleenciadebase
ecuenciasob
4.Esta imagenpiodelmtodo
sconelmismorelectroforbucindelode los cuatrloenelgel,es(Figura4
btenidascon
nseencuentradedideoxinucle
moextremoresisdesnatusresiduosTro nucletidseobtieneu
4y5).
estemtod
en laNobelLeetidostermin
Figura 5.Se tratamezclasimagensLas lectudeacuerdnucletid
Mto
5yconresuralizanteenTiminaenelos en reaccunpatrnde
oalcanzaban
ecturedeF.Saadores.
Estaimagencodeun autorad(una para cadeleenlassecuerasserealizandoalaaparicidodediferencia
odosdesecu
iduosddTenngelesdeacADNsintetizciones indepebandasap
nhasta200
angerde1980.
orrespondealadiografa dndeda dideoxinucleenciasdeADNdeabajo(frag
ndelasbandaaentamao.
enciacinde
nelextremocrilamidaelzado.Utilizanpendientes,partirdelcua
basesdelarg
En lamismas
asegundafigure semuestra laetido termina(enestecasougmentosmsps.Laresolucin
ecidosnuclGonzalo
o3.Siestampatrndebndoterminay corriendoalsepuedel
go.
seejemplificae
adelartculodamigracin deador utilizado).unfragmentodequeos)haciandelgel,permi
leicos.oGreif
5
mezclaandasadores cadaeerla
el
eSanger(PNASe las cuatrodif. A la derechelbacterifagoaarriba(msgitesepararban
S,1977).ferentesha de laoX174.grandes),dasde1
a
I.
En 19primecontmolenunLas snucle
II
LaemprimesecueUSA)secueEn 19secueConedesarestracopiaVentede43
a. Avancesy.Secuenciaci986 Hood yerreportedeerminadoresculafluorescnnicotubosecuencias oetidos.
I.SecuenciacmpresaAppler secuenciaenciadelpri.Laaparicienciacin.El992,Venterenciacincoestaplataforrrollodelaetegia consisa) y clonarlaerreporta33millonesde
a.
ymejorasenincontermy colaboradoeautomatizasfluorescentcentedifereo(Figura).Asobtenidas, co
cinautomtliedBiosysteador autommergenporndelossecprimerodefundael Inn30equiposrma instaladestrategiaESteenhaceras de forma37geneshuesecuencias
b.
nelmtodominadoresfluores, en colaacindelastescomovanteunidaasimismo,lason esta nue
tica.ems, fue laptico (ABI 37rCraigVenteuenciadoreseellosfueelstitute forGs.da,sedemueT(expressedcopiasdeAaleatoria p
umanosnoccorrespond
Fipadepasele
c.
Mto
deSanger(1uorescentes(aboracin csecuenciaciriantedelmcadadideoxsecuenciapueva variante
pionera y ld70A) aparecerysuscoleautomticoNIH,dndeGenomicRes
estraelpoddsequencetADN apartirara luego seonocidos.Lientesa130
gura6.Enestaaracadabase)elgel(cadacoloaraconvertiresecuenciadeADctura53.
odosdesecu
19771996).(dyeterminaon AppliedndeADN,q
mtododeSainucletido,uedeserlederan de un
deren instruce en 1987,egasdelNatospermitilaese instalarosearch (TIGR
erde lasectag)paraeldrdelARNmecuenciar. Eabasededa0organismo
afiguraseejem(a),secorrenorrepresentausassealesenDN (c). La flech
enciacinde
atorsequencBiosystems
queestableceanger.Estvaypermitere
daatravsdn largo de e
umentosdey con l seionalInstitutainstalacinon6secuencR) y expande
uenciacinadescubrimienmensajero ceEn 1991, conatosdeESTosdiferentes
mplificacomoetodas lasreacunabase)(b)yelectroferograha a la izquierd
ecidosnuclGonzalo
cing).(ABI) publicelasecuencarianteutilizealizarlareaeuncomputentre 500 y
secuenciaci logra conoteofHealthndefacilidadciadoresABIe la capacid
automticacntodegeneselular (ADNcn esta estracontieneho.
nlugarde4cacionesenunsedesarrollanaamasquereprda indica ladir
leicos.oGreif
6
can eliacinzaunaaccintador.1000
n.Elcer la(NIH,desdeI3700.ad de
conels.Estac=ADNategia,yms
rriles(unonicocarrilalgoritmosresentanlareccinde
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
7
b. ProyectoGenomahumano:Lasecuenciacindelgenomahumanosevolviunobjetivorealizableunavezestablecidaslasmetodologas de secuenciacin de ADN. La discusin formal comenz en 1985 en EstadosUnidos.En1990,sepresentunproyectode5aosenelcongresodeEstadosUnidos(HumanGenomeProject).Seestimabaqueelproyectodurara15aosyelcosto rondara los3milmillones de dlares. El proyecto estableca el objetivo demapear y secuenciar diferentesorganismos modelo adems de humano. Entre ellos E. coli, S. cerevisiae, C. elegans, D.melanogaster y el ratn (Mus domesticus). El proyecto se convirti en un esfuerzo decolaboracininternacionalentrediversoscentrosdesecuenciacinenEstadosUnidos,EuropayJapn.Cadacentrosefocalizenregionesparticularesdelgenoma,quepermitieranobtenerunmapa.En1994sepublicunmapadetalladodelgenomahumanoqueincluaelmapeode5840lociconunamediadeespaciadode0,7cM(1centiMorgan=106bases).En1998,elproyectopblico,compitiendoahoracon laempresaCelera (propiedaddeCraigVenter)adoptalossecuenciadorescapilaresdeAppliedBiosystems(ABI3700). En1999elproyectoGenomahumanohaba secuenciadomsdemilmillonesdebasesysepubliclasecuenciacompletadeuncromosomahumano(elcromosoma22).Para el mismo tiempo, Celera, comenz asecuenciarelgenomahumanocon laestrategiade whole genome shotgun sequencingdesarrollada por C. Venter (explicada msadelante). La secuenciacin comenz ensetiembrede1999yenjuniode2000serealizun ensamblaje inicial de las secuenciasobtenidas. Los datos de Celera permitieron elensamblaje del genoma humano con unacobertura de 5X (ver Cobertura). Adems seaumentlacobertura3Xconlosdatospblicos.El 25 de junio de 2000, en la Casa Blanca, elpresidente Clinton junto a Francis Collins(responsabledelproyectopblico,NIH) yCraigVenter, anunciaron pblicamente la versinborrador del genoma humano realizada tantoporelesfuerzopblicocomoprivado(Figura7).Enfebrerode2001,sepublicaronlosborradoresdelconsorciopblicoydelprivadoenScienceyNature(Figura8).Finalmenteenelao2004sepubliclaversinfinaldelgenomahumano.
Cobertura(Coverage):La cobertura es elnmeropromediodesecuencias que representan a undeterminado nucletido en la secuenciatotalreconstruida.Puedesercalculadaapartirdellargooriginaldelgenoma(G),elnmero de secuencias (N) y el largopromediodelassecuencias(L)como:Cobertura=NxL/GEjemplo.Ungenomahipotticode2000bases,secuenciadocon24secuenciasde350 bases de promedio de largo tieneunacoberturade:24x(350/2000)=4,2X.Este valor significa que el genoma fuesecuenciado 4,2 veces. Cunto mayorcobertura, menor posibilidades deerroresenlasecuenciafinal.
Whol
Elmclonaobtensolapasin eminflue
En19mejor(Haemcolaboratn
En20JCVSFtrabaj
egenomeShotododeWhorloenplsminidas,lassecuan(Figura9).mbargo Ventenzae,1,8Mb)
95,Venterysrados de secmophilus influoradores, com).006se fundF,etc.).Setrajando.
ra9.Esquemaeradosalazar
otgunsequenleGenomeShidos y secuenuenciassealinElmtodofuer fue el primyproponerlo
sugrupodecidcuenciacinuenzae).EnTmenzaron en
el J.CraigVetadeunaorg
adesecuenciaryensamblaj
ncingyCraigVhotgunconsisnciarambashneanyensameutilizadopomero en utilocomoestrate
denutilizarnupara realizarIGRanalizarmtonces la sec
nter Instituteganizacinlde
acinconlaeedelasecuen
Mto
Figura7.Fohumanoe Figura8.Tlosborrad
Venter:steenlafragmhebras (elpasmblanparafororSangeren1izarlo para seegiaparasecu
uevasherramr la primermsde50 gecuenciacin d
e (JCVI)por laerengenmi
estrategiadeSnciautilizando
odosdesecu
otodelanzamnWashington
apasderevistdoresdelgeno
mentacinalasode clonadormarcontigsb1982paraensecuenciar unuenciarelgen
mientascompusecuencia deenomasmicrode genomas d
aunindevacaanivelmu
Shotgun.Secuoprocesamien
enciacinde
mientodeborrn(Clinton,Ven
tasNatureySomahumano.
azardelADNo luego fueebasndoseensamblarelfaggenoma deomahumano
utacionalesase un organisobianos.Ventdemayor tam
riasorganizacundialconm
uenciacindentoinformtic
ecidosnuclGonzalo
radordelgenonter,Collins).
Sciencede200
detodoelgeeliminado).Unlassecuenciagolambda(48mayor tama
o.
scomolosmsmo de vidater yalgunodmao (mosca
ciones (TIGR,sde400cien
fragmentosco.
leicos.oGreif
8
oma
01con
enoma,na vezasque8,5kb),o (H.
todosa librede sus, rata,
TCAG,ntficos
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
9
4. AlgunosMtodosdesecuenciadomasivoPasaroncercade30aosdesde lapublicacindelmtododeSanger,hastaqueaparecierauna nueva tecnologa de secuenciacin de cidos nucleicos que no fuera el mtodo dedideoxinucleotidosterminadores.Laprincipalcaractersticadeestasnuevasmetodologasesla posibilidad de secuenciado masivo de forma paralela, esto significa que el nmero desecuenciasobtenidasduranteunacorridasuperamuchasveceselmximode96secuenciasporcorridaqueseobtienenconlossecuenciadorescapilaresdeltimageneracinqueutilizanelmtododesecuenciadodeSanger.
A partir del desarrollo del mtodo de pirosecuenciacin (primer mtodo de secuenciadomasivo utilizado, 2005), surgen nuevas alternativas de secuenciacin que utilizan elmismoprincipio de dideoxinucleotidos terminadores en sus protocolos, aunque con mejorasinnovadoras.
Estosnuevosmtodosdesecuenciadomasivonoofrecenlecturastanlargascomoelmtodoclsico de Sanger, aunque en pocos aos se hamejorado sustancialmente el largo de lassecuenciasobtenidasyenalgunoscasosalcanzanlongitudescomparablesaSanger.
a. Pirosecuenciacin:
Elprimermtododesecuenciadomasivoonextgenerationsequencing(NGS),fuepublicadoen2005enNature,y llevadoalmercadopor laempresa454 (luegoadquiridaporRoche).Elresumen de este artculo explica: Describimos un mtodo escalable, un sistema desecuenciacin altamenteparalelizable conun rendimiento significativamentemayorque losinstrumentosdeelectroforesiscapilar.Elaparatopermitesecuenciar25millonesdebases,con99% de precisin en una corrida de 4 horas (este rendimiento es 100 veces superior a lacantidaddebasessecuenciadasenesetiempoenunsecuenciadorde96capilares).
En el primer artculo, publican la secuenciacin de novo del genoma de Mycoplasmagenitaliumalcanzandocubrirel96%delgenomayconunaprecisinde99,96%enunacorrida.
Elmtodoconsisteen4pasos:1. FragmentacindelADN(oARN).2. Ligacindeoligonucletidos(adaptadores)encadaunodelosextremos.3. Amplificacinclonal(mediantePCRenemulsin).4. Secuenciadoporsntesisusandounprotocolodepirosecuenciacinoptimizadoenun
soporteslidoyenescaladepicolitros.Ms en detalle, luego de fragmentar elADN, se ligan oligonuclotidos adaptadores a cadaextremo del ADN. Estas secuencias adaptadoras comunes a todos los fragmentos sernutilizadas,tantoparaligarcadafragmentoalasesferas,comosecuenciasdondeseunirnloscebadores de la PCR y adems presenta la secuencia donde se unir el cebador desecuenciacin.Unavezligadoslosadaptadores,seliganalasbeads(esferasquecontienenelcomplementarioaunodelosadaptadoresensusuperficie),porunmtododedilucinlmite,demododeobtenerunnicofragmentounidoaunaesfera.Sebusca,entonces,obtenerencadabeadunnicofragmentodeADN,elmismoesamplificadomediantePCRenemulsin.
PCReLa Pindepesferobtenfragmmicelreactmicro
Figuracomplemulsframgecofactmilesfragme
Luegopreseplacaunbepodesecue
enemulsinCR en emupendientes.Uas que contner un nicmentodeADlas de aceitetivos necesaoreactoresd
a 10. Esquemaementariasauin (aguaaceitentoyencontrores).(3)Luegode reaccionesentounidoaun
o de finalizentaron ampa(picoTiterpead(Figura1mos decirenciadoresd
(emPCR):ulsin permUnavezobtetienen unoo fragmentoDN)esemulse independiarios para lndeselleva
de la PCR enunode losadate)de tal formramosademsoserealizaunaenparalelo. (4nabead.
ada esta replificacin. Lplate),tiene11).Encadaque tenem
de96capilare
ite realizarenidalalibrede los adapo por esferasionadaenuentes cadalevar adelaaadelantela
n emulsin. (1aptadoresquemaqueen cadatodos los reacaPCRconvenci4) Luegoden
eaccin, seLasmismas1,6millonespocillosuced
mos 1,6 miesaproximad
Mto
en un nieradefragmptadores prea. Luego launamezclada uno de ellonte la reacareaccinde
1) Se liga a caseencuentrana gotade aceitctivosnecesarioonal,peroencciclosde reacc
rompe la eson depositsdepocillos,derunareallones de sdamente.
odosdesecu
ico tubos mmentosquesesentes en lpoblacin ddeaguayacos con unaccin. El reePCRdeform
ada bead un fen la superficte encontremoospara llevaracadatuboderecin, seobtien
emulsin ytadas en layencadauaccindesecsecuenciado
enciacinde
miles de resernsecuenlos fragmende esferas (ceite,demonica esferaesultado finamaindepend
fragmento mediede lasmismosunanicabeadelante laPCReaccinserealie unaamplific
se recuperaplaca de seunodeelloscuencia,porres de 1 c
ecidosnuclGonzalo
acciones denciados,seutos, demodcada una codotaldeoba y con todoal, son milediente(Figur
diante las secumas. (2)Se realeadunida aunR (dNTPs,Polimizansimultneacacin clonald
an las beadsecuenciacinslopuedeelocualenlacapilar, o 1
leicos.oGreif
10
e PCRunenado deon unbteneros loses dera10).
uenciasizaunannicomerasa,amentede cada
s que. Estaentrarplaca16000
Figuradelos
ReaccEstetermdndvez,incornaciepirofomediemitibasedetecpirofo(FigucadaEn elhomolacanEjemEnelobserluzemobserlaba
a11.PicoTitrepocillosyejem
cindesecumtodo
inadores.Eneseofrece
secuenciaporacin deente de ADosfato liberante dos pdaencadapofrecida,
ccin luminoosfato durara).Unacmbase,encadl caso de hoopolimeroesntidaddebaplo:primerciclorvalaemisimitida).LuegrvanlospocseG,y luego
plate.Arriba:emplodecargade
enciacin:no utili
nestecaso,encadapocalmente.e una baseDN se liberarado se coprocesos enzpocillo,dndes monit
omtrica dente la reacmaraCCDcodacicloyenomopolimerosdeterminasesincorpor
oseofrecendeluz(degodeobtenillosqueincoo laCparat
squemadedepeunaplaca.
za nuclese realizancillounabasDuranteen unamola pirofosfatonvierte enzimticos. Ldeseincorpotoreada pola liberaci
ccin de snlectalosdatcadaposicios (tractos ddoapartirdrada).
labaseA,eependiendoidas las imorporanT.Sterminarelp
Mto
posicindeesfe
tidosciclosepor
laculato, eln luzLa luzorlaor lan delntesistosden.de secuenciade lacantida
n todos loslacantidaddgenes,sereevuelveaeprimerciclo.
Figura
odosdesecu
erasenlospoci
a con elmisaddepirofos
pocillos.EndeAincorpoemueve labaliminarlabaLuegode1
a12.Esquema
enciacinde
illos.Abajo:mic
smo nucletsfato liberad
aquellosquorada,serlase,yseofreasenoincorp00ciclosfin
dereaccinde
ecidosnuclGonzalo
crografaelectr
tido), el largdo(proporcio
uese incorpoaintensidadece labaseTporadayseoaliza lacorri
pirosecuenciac
leicos.oGreif
11
rnica
go delonala
oraseddelaTyseofreceida.El
cin
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
12tamaopromediode cada lecturaesde400basesyenuna corrida seobtienen cercade1millndesecuencias(esdecir400millonesdebases/10horasdecorrida).
b. Illumina:Lasegundatecnologadesecuenciacinmasivaquesalialmercado (2006) fue ladeSolexa(luego adquirida por Illumina). En esta tecnologa, se utilizan nucletidos terminadoresmarcadosconmolculasfluorescentesaligualqueenlaSecuenciacindeSanger.Ademsdela paralelizacinmasiva (es decir la capacidad de realizarmillones de secuencias en cadacorrida),ladiferenciaconelmtodoconvencionaleslaposibilidaddeeliminarlafluorescenciaunavezobtenidalaimagen,ydesbloquearcarbono3demodoquepuedaaceptarunanuevabase para continuar la reaccin de secuenciacin, haciendo que la incorporacin de unnucletidoterminadorseareversible.Enestecaso,laslongitudesobtenidassonmenoresquelossecuenciadores454(enlaactualidadhasta150bases),sinembargolacapacidadderealizarsecuenciasenparaleloesmuchomayorqueen454(hasta250millonesdesecuencias).Comoresultadoesposibleobtenerhasta6x1012enunasolacorrida.Paradimensionarestenmero,elgenomahumanotieneaproximadamente3x109basesdelargo.Al igual que el mtodo de secuenciacin de Roche, los primeros pasos consisten en lafragmentacindelADNyligacindeadaptadores.Luegohayunpasodeamplificacin(enestecaso, laamplificacinesenunasuperficieslida:flowcell,dndetambinsedar luego lareaccindesecuenciacin).AmplificacinyReaccindesecuenciacin:En el primer paso, la librera se deposita en la flow cell por complementariedad con losadaptadores (1). Luego se produce la amplificacin en puente (2 y 3) en sucesivos ciclos(4,5,6,7,8)hastaobtenerunclusterconlaamplificacinclonaldelfragmentoinicial(8)(Figura13).Figura13.Amplificacinenpuente.Verdescripcineneltexto.
En la reaccin de secuenciacin, se bloquea uno de los adaptadores (1), y se comienza lareaccindesecuenciacindesdeelotroextremo (2)medianteuncebadorespecfico (Figura14).
1 2 43 5 6 7 8
1 2
Figura14.ReaccindesecuenciacindeIllumina.Verdescripcineneltexto.
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
13
1 2 43
Durante la reaccin, adiferenciade lapirosecuenciacin, seofrecen los cuatronucletidosterminadoresmarcadoscadaunoconunfluorocromodiferente(1),aligualqueelmtododeSanger.Luegodeunlavado(2),seobtienenlasimgenesyseobtienelaprimerabasedecadacluster(3).Luego,seeliminaelfluorocromoysedesbloqueaelCarbono3,permitiendoqueunnuevo nucletido pueda extender la cadena de ADN naciente (4). Otra vez los cuatronucletidosterminadoresmarcadossonofrecidosa losclusters,comenzandounnuevociclo(Figura15).
Figura 15. Reaccin de secuenciacin de Illumina. Primer ciclo de secuenciacin (1), incorporacin dedideoxinucletidosmarcados(2),adquisicindeimagen(3),ylavado,desbloqueo,yeliminacindemarcado(4).
Losltimosmodelosde Illuminapermiten secuenciar enparalelomsde 3000millonesdeclustersconlargosdesde35a150bases(www.illumina.com).
c. Otrosmtodos:Desde2005hastalafecha,otrastecnologasdesecuenciacinmasivahansidodesarrolladasyotras se encuentran en desarrollo y constituyen una nueva generacin de secuenciadores(Tabla1).Esimposibleenestecaptuloeldesarrolloenprofundidaddecadaunadeellas,porlotantoenlasiguientetablasemuestranotrastecnologasylasfuentesdndeobtenermayorinformacindecadaunadeellas.Algunasdeestastecnologas(SMRT,Helicos)proponenlasecuenciacinapartirdeunanicamolculadeADNentiemporeal.Unadeellas(PacificBiosciences)enteoranotienelmiteencuntoal largode lassecuenciasgeneradasyeventualmentepodrasecuenciarcromosomasenterosenunanicalectura(www.pacificbiosciences.com).Otras, como Oxford nanopore e Ion Torrent (recientemente lanzada al mercado) ofrecennovedosas soluciones y no requieren marcacin fluorescente ni cmaras registradoras deimgenes.Enparticular, IonTorrent (ver recuadro J.Rothberg),sebasaenel registrode loscambiosdepHproducidosdurante la incorporacindebasesdurante lasntesisdeADN.Setrata de micropHmetros que reducen notablemente los costos de secuenciacin(www.iontorrent.com)yprometenserherramientastilesenelreadediagnstico.
SG(HS
IoO
Tabla
PlataOLiD(ApplieGenetic AnaHelicos)MRT(Pacific
onTorrentOxfordNanop
RothbergnaIngenieraBUniversidadElDr.Rothbpginawebsuhijo fuersalud. SubsDirigilasedelDr.WatGenomeProLacontribubacterial(eEn 2007,RTorrentydeAdemsesfRothbergInFuente:http
1.Informacin
formaedBiosystemalysis Syste
cBiosciences
pore
acien1963BiomedicaenddeYale.bergeselpi(www.iontora internadosecuentemenecuenciacintson).Ademoject,encolcindeRothmPCR).othberg comesarrollaelcfundadordenstituteforC://www.ionto
sobreotrastec
Tem) Ligacinem true Si
Sequens) Single
timeMicropLabelfr
JonathanMFundadory
3enNewHanCarnegieM
ioneroenelorrent.com),oencuidadonte, funda 4delprimergsinicielpaboracincohbergalsec
menzunnuconceptodeeotrasempreChildhoodDisorrent.com/te
cnologasdese
ecnologaningle MoleccingMolecule R
pHmetrosee,electrica
M.RothbergCEOdeIonT
aven,ConnecMellonUnive
desarrollodlaprimeraid
os intensivos454 Life SciegenomahumprimerproyeonelDr.Paauenciadoma
uevonegocisecuenciaci
esas,vinculasease.eam/jonathan
Mto
ecuenciacinma
Long50bas
cule 25a5
Real >1000(enteo>200b
l ND
g,Ph.D.(19Torrent.
cticut.Segrarsity,yrealiz
detecnologdeasobreelsysecuestioences, lanzanmanodeunictodesecuebo).asivo incluye
o, a razdenconpHmadasalatecn
rothberg/
odosdesecu
asivaenelmer
gituddereadses5bases
basesorasinlmitbases
963)
adueningezluegosum
asdesecuesecuenciadoonara la impndo almercndividuo(seenciadomas
eeldesarrol
un comentmetros.nologayme
enciacinde
rcadoocercade
ds Ao200200
e)ND
201ND
enieraqumimaestraydo
nciacinmaomasivoenportanciadeado el primcuenciandosivodeunAD
lodelprime
ario de su h
edicina.Esta
ecidosnuclGonzalo
esalir.
o7 www.ap8 www
D www.pa
1 wwwD www.
caconopcioctoradoen
siva.Segnparalelosurelgenomaher secuenciaexitosamentDNantiguo(
ersistemade
hijo.Rothbe
mbinfunda
leicos.oGreif
14
Webppliedbiosystems.co
w.helicosbio.com
acificbiosciences.co
w.iontorrent.com
nanoporetech.com
nenla
cuentaen lageluegoqueumanoen laadormasivoteelgenoma(Neandertha
eclonadono
rg funda Ion
adordeThe
om
m
aeao.aal
o
n
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
15
GenomaHumanoySecuenciacinmasiva:Comoyavimosantes, lasecuenciadelgenomahumanasepublicen2004.Lasecuenciacindeestegenoma tuvo un costo aproximado de 3000millones de dlares y cerca de 20 aos de trabajo. Enoctubrede2007,sepublicaelprimergenomadeunnico individuo(J.CraigVenter),realizadoporelmtododeshotgunysecuenciacinSanger.Elcostodeestegenomafueaproximadamente70millonesdedlaresyunaduracinde4aos.Elprimergenomahumanosecuenciadocon latecnologa454fueeldelDr.JamesWatson,auncostode1millndedlaresyendosmeses(2008). Elcostohacontinuadobajandoysehanreportado lasecuenciacindeungenomahumanopormenosde100.000dlares.Variosproyectostienencomoobjetivo lasecuenciacindems individuos,entreelellosTheCancerGenomeAtlasy1000Genomeproject.Hacetansolo10aos,2dedoseransuficientesparacontarel nmerodegenomassecuenciados.En2009, alcanzaban los dedos de ambas manos. Hoy, es difcil de saberlo exactamente, pero unrelevamiento realizadopor la revistaNature, indicaque cercade30.000 genomashumanosestarnsecuenciadosparafinalesde2011.
d. Aplicaciones
La produccin de un gran nmero de lecturas a bajo costo permite la aplicacin de lasplataformas de secuenciadomasivo enmuchas aplicaciones, y es imposible describir todasellasaqu.Laprimeraaplicacinobviaeslasecuenciacindegenomas(verrecuadroGenomaHumano y Secuenciacin masiva) y la precisa anotacin de genes (sitios de splicing,poliadenliacin,secuencias5y3UTR,etc).Dentrodelasprimerasaplicacionesencontramosla secuenciacin de ARN (ej. descubrimiento de ARN pequeos, nuevas variantes gnicas,nuevos genes, etc.) y amplicones de PCR (secuenciado de ARNr16S y su aplicacin enmetagenmica como veremos en el siguiente prrafo). Asimismo, la posibilidad decuantificacindetranscriptosqueofreceestatecnologa(RNAseq),lavuelveunaalternativaalosexperimentosdemicroarreglos.Lasecuenciacinparaidentificarmarcadoresepigenticos,identificar interaccinADNprotena, determinarestructuradecromatina(ChIPSeq,Methylseq,DNaseseq)sonaplicacionescadavezmsutilizadas.LametagenmicaeselestudiogenmicodemicroorganismosporlaextraccindirectadeADNde una comunidadmicrobiana. La aparicin de la secuenciacinmasiva ha facilitado a losinvestigadores la tareade identificacinycaracterizacindediferentesmicroogranismos,endiferentesambientes.En la seccinde lecturas recomendadas seofrecen revisionesbibliogrficasde cadaunadeestasaplicacionesparaqueellectorprofundiceenellas.
Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif
16Lecturasrecomendadas:1. Sanger F. Coulson R. A rapid method for determining sequences in DNA by primed
synthesiswithDNApolymerase. J.Mol.Biol.,94,441448 (1975).MtodomsmenosdeSanger.
2. MaxamA.andGilbert.AnewmethodforsequencingDNA.PNAS,74(2),560564,(1977).Articulodndesedescribemtodoqumicodesecuenciacindecidosnucleicos.
3. Sanger,F.,Nicklen,S.andCoulson,A.R.DNAsequencingwithchainterminatinginhibitors4. PNAS, 74 (12), 54635467 (1977). Artculo de Sanger dnde describe el mtodo de
secuenciacinutilizandodideoxinucletidos.5. Sanger, F. Determination of nucleotide sequences inDNA.Nobel lecture, 8December
1980.6. Venter,C.etal.TheDiploidGenomeSequenceofan IndividualHuman.PLOSBiology,5
(10),(2007).PublicacindegenomadeCraigVenter.7. International Human Genome Consortium. Finishing the euchromatic sequence of the
humangenome.Nature431,931945(2004).8. Margulies,M.etal.Genomesequencinginmicrofabricatedhighdensitypicolitrereactors.
Nature437,376380(2005).Losautoresdescribeneldesarrollodelaprimertecnologade secuenciadomasivo,y realizanelensamblajedenovodelgenomadeMycoplasmagenitualiumutilizandopirosecuenciacin.
9. Bentley,D.R.etal.Accuratewholehumangenomesequencingusingreversibleterminatorchemistry. Nature 456, 5359 (2008). Artculo de los desarrolladores de Illumina,reportandoelusodeestatecnologaparalasecuenciacindeuncromosomahumano.
10. Wang, Z.,Gerstein,M.& Snyder,M. RNASeq: a revolutionary tool for transcriptomics.NatureRev.Genet.10,5763 (2009).Review sobreusode tecnologasde secuenciadomasivoparaanlisisdetranscriptomas(RNAseq).
11. Park, P. J. ChIPseq: advantages and challenges of amaturing technology.Nature Rev.Genet.10,669680(2009).RevisinsobreChIPseq.
12. Morozova, O.,Hirst, M., Marra, M. Applications of New Sequencing Technologies forTranscriptome Analysis. Annu. Rev. Genomics Hum. Genet. 10,13551 (2009). RevisinNGS.
13. Petrosino, J. F., Highlander, S., Luna, R. A., Gibbs, R. A. & Versalovic, J.Metagenomicpyrosequencingandmicrobial identification.Clin.Chem.55,856866 (2009).Setratadeunreviewsobremetagenmica.
14. Zhou,X.,Ren,L.,Meng,Q.,Li,Y.,Yu,Y.,Yu,J.Thenextgenerationsequencingtechnologyandapplication.ProteinCell,1(6),520536(2010).RevisinNGS.
15. Metzker,M.L.Sequencing technologies thenextgeneration.NatureReviewsGenetics11,3146(2010).RevisinNGS.
16. Human genome: Genomes by the thousand. Nature 467, 10261027 (2010). Revisinsecuenciadoresinstaladosygenomassecuenciados.
17. Zhanga,J.,Chiodinic,R.,Badra,A.,ZhangG.Theimpactofnextgenerationsequencingongenomics.Genet.Genomics.38(3),95109(2011).RevisinNGS.
Otrosrecursosinteresantes:1000GenomesProject:http://www.1000genomes.orgTheCancerGenomeAtlas:http://cancergenome.nih.govTheExomeProject:http://www.nhlbi.nih.gov/resources/exome.htmHumanMicrobiomeProject:http://nihroadmap.nih.gov/hmpPersonalGenomeProject:http://www.personalgenomes.orgCraigVenterInstitute:www.jcvi.org