Cap 2_Bases Moleculares de La Herencia_Castillo

44
Bases moleculares de la herencia INTRODUCCIÓN La vida como se conoce está especificada por los geno- mas. Cada organismo posee un genoma que contiene la información biológica necesaria para construir y mante- ner un ejemplo viviente de ese organismo. La mayoría de los genomas están constituidos de ácido desoxiribonu- cleico (DNA), a excepción de algunos genomas virales en los que la información genética está contenida en moléculas de ácido ribonucleico (RNA). Este capítulo se enfocará al genoma de los organismos eucariontes y en particular al humano. En las células eucariontes las moléculas individuales de DNA se encuentran en los cromosomas del núcleo y de manera adicional cada mitocondria posee varias copias de una pequeña molécula de DNA, al igual que los cloroplastos de las células vegetales. Las principales funciones de un genoma son almacenar la información genética, duplicarla para transmitirla de una generación a otra (replicación), permitir su expresión (transcripción y traducción), y su capacidad para sufrir cambios (muta- ción) que lleven a evolución. Una mutación es un cam- bio en la secuencia de nucleótidos del genoma que es permanente y heredable. La información biológica contenida en un genoma está codificada en la secuencias de nucleótidos de sus moléculas de DNA o RNA y está dividida en unidades discretas denominadas genes. La información contenida en un gen es leída en posiciones adecuadas que inician una serie de reacciones bioquímicas que se conocen como expresión génica. Este proceso comprende dos eta- pas: transcripción y traducción. En la primera se produ- ce una copia de RNA del gen y la segunda resulta en la síntesis de una cadena polipeptídica cuya secuencia de aminoácidos está determinada, vía código genético, por la secuencia de nucleótidos del RNA mensajero (mRNA). El dogma central, propuesto en 1956 por F. Crick, establece el flujo de la información genética de DNA a DNA, de DNA a RNA, y de RNA a proteínas. En los retrovirus, virus con genomas de RNA, la informa- ción genética fluye de RNA a DNA durante la conver- sión de los genomas virales a sus progenomas celulares de DNA. Este proceso, conocido como transcripción inversa (reversa), es catalizado por la enzima transcrip- tasa inversa. Otro flujo posible de la información genéti- ca es de RNA a RNA, proceso que permite replicar los genomas presentes en la mayoría de los virus de RNA (figura 2-1). La transcripción genera diferentes tipos de moléculas de RNA, clasificadas en dos grupos principales: RNA codificantes y RNA no codificantes (ncRNA). Los mRNA son los únicos que contienen una secuencia que puede ser decodificada para generar una molécula poli- peptídica. Los ncRNA no sirven como molde para sinte- tizar polipéptidos y están implicados tanto en el proceso de la expresión génica como en su regulación. En todos los seres vivos los genomas están constitui- dos por moléculas de DNA de doble cadena. La cadena de DNA que tiene la misma secuencia que la molécula de RNA se nombra como cadena sentido, mientras que la que sirve como molde o templado para la transcrip- ción es la antisentido. Para que una secuencia de DNA pueda ser transcrita requiere de una secuencia específica de nucleótidos, llamada promotor. Cuando se transcriben ambas cadenas de una molécula de DNA, al transcrito resultante de la cadena sentido se le llama RNA antisen- tido. Para que una molécula de RNA pueda ser traduci- da debe tener un marco de lectura abierto (ORF, open reading frame), esto es contener un codón de inicio para la síntesis proteica y continuar con codones para al menos 100 aminoácidos, antes de la presencia de un codón de paro. Dado que no existe puntuación en el código genético toda molécula de DNA puede tener potencialmente 6 diferentes marcos de lectura, tres para cada molécula de RNA, sentido y antisentido. Los mRNA incluyen en su parte central un ORF y en sus extremos se encuentran secuencias que no se traducen y se conocen como UTR 5’ y 3’ (untranslated regions), y que son importantes en la estabilidad y unión de los mensajeros a los ribosomas para su traducción. Alicia B. Cervantes Peredo, Marisol López López, Diego J. Arenas Aranda, Rosenda I. Peñaloza Espinosa © Editorial El manual moderno Fotocopiar sin autorización es un delito. 1 2

Transcript of Cap 2_Bases Moleculares de La Herencia_Castillo

Page 1: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia

INTRODUCCIÓN

La vida como se conoce está especificada por los geno-mas. Cada organismo posee un genoma que contiene lainformación biológica necesaria para construir y mante-ner un ejemplo viviente de ese organismo. La mayoría delos genomas están constituidos de ácido desoxiribonu-cleico (DNA), a excepción de algunos genomas viralesen los que la información genética está contenida enmoléculas de ácido ribonucleico (RNA). Este capítulo seenfocará al genoma de los organismos eucariontes y enparticular al humano.

En las células eucariontes las moléculas individualesde DNA se encuentran en los cromosomas del núcleo yde manera adicional cada mitocondria posee variascopias de una pequeña molécula de DNA, al igual quelos cloroplastos de las células vegetales. Las principalesfunciones de un genoma son almacenar la informacióngenética, duplicarla para transmitirla de una generacióna otra (replicación), permitir su expresión (transcripcióny traducción), y su capacidad para sufrir cambios (muta-ción) que lleven a evolución. Una mutación es un cam-bio en la secuencia de nucleótidos del genoma que espermanente y heredable.

La información biológica contenida en un genomaestá codificada en la secuencias de nucleótidos de susmoléculas de DNA o RNA y está dividida en unidadesdiscretas denominadas genes. La información contenidaen un gen es leída en posiciones adecuadas que inicianuna serie de reacciones bioquímicas que se conocencomo expresión génica. Este proceso comprende dos eta-pas: transcripción y traducción. En la primera se produ-ce una copia de RNA del gen y la segunda resulta en lasíntesis de una cadena polipeptídica cuya secuencia deaminoácidos está determinada, vía código genético, porla secuencia de nucleótidos del RNA mensajero(mRNA). El dogma central, propuesto en 1956 por F.Crick, establece el flujo de la información genética deDNA a DNA, de DNA a RNA, y de RNA a proteínas.En los retrovirus, virus con genomas de RNA, la informa-

ción genética fluye de RNA a DNA durante la conver-sión de los genomas virales a sus progenomas celularesde DNA. Este proceso, conocido como transcripcióninversa (reversa), es catalizado por la enzima transcrip-tasa inversa. Otro flujo posible de la información genéti-ca es de RNA a RNA, proceso que permite replicar losgenomas presentes en la mayoría de los virus de RNA(figura 2-1).

La transcripción genera diferentes tipos de moléculasde RNA, clasificadas en dos grupos principales: RNAcodificantes y RNA no codificantes (ncRNA). LosmRNA son los únicos que contienen una secuencia quepuede ser decodificada para generar una molécula poli-peptídica. Los ncRNA no sirven como molde para sinte-tizar polipéptidos y están implicados tanto en el procesode la expresión génica como en su regulación.

En todos los seres vivos los genomas están constitui-dos por moléculas de DNA de doble cadena. La cadenade DNA que tiene la misma secuencia que la moléculade RNA se nombra como cadena sentido, mientras quela que sirve como molde o templado para la transcrip-ción es la antisentido. Para que una secuencia de DNApueda ser transcrita requiere de una secuencia específicade nucleótidos, llamada promotor. Cuando se transcribenambas cadenas de una molécula de DNA, al transcritoresultante de la cadena sentido se le llama RNA antisen-tido. Para que una molécula de RNA pueda ser traduci-da debe tener un marco de lectura abierto (ORF, openreading frame), esto es contener un codón de inicio parala síntesis proteica y continuar con codones para almenos 100 aminoácidos, antes de la presencia de uncodón de paro. Dado que no existe puntuación en elcódigo genético toda molécula de DNA puede tenerpotencialmente 6 diferentes marcos de lectura, tres paracada molécula de RNA, sentido y antisentido. LosmRNA incluyen en su parte central un ORF y en susextremos se encuentran secuencias que no se traducen yse conocen como UTR 5’ y 3’ (untranslated regions), yque son importantes en la estabilidad y unión de losmensajeros a los ribosomas para su traducción.

Alicia B. Cervantes Peredo, Marisol López López, Diego J. Arenas Aranda, Rosenda I. Peñaloza Espinosa

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

1

2

Page 2: Cap 2_Bases Moleculares de La Herencia_Castillo

En la mayoría de los eucariontes las regiones codi-ficantes, tanto para polipéptidos como para moléculasde ncRNA, están interrumpidas en segmentos deno-minados exones separados por secuencias de interven-ción no codificantes llamadas intrones. Ambos tiposde secuencias son transcritas a partir de la secuenciadel gen y, a continuación, los transcritos primarios sonprocesados para obtener las moléculas de RNA madu-ras o funcionales. Durante la transcripción de losgenes que codifican para polipéptidos, se sintetizantranscritos primarios o RNA premensajeros, tambiénllamados RNA heteronucleares (hnRNA). A conti-nuación los transcritos primarios son procesados en elnúcleo para remover los intrones y empalmar a losexones, generando RNA maduros que son transporta-dos al citoplasma en donde los mRNA son traducidosa polipéptidos.

De forma clásica un gen había sido visualizadocomo una unidad hereditaria constituida por unasecuencia nucleotídica de DNA o RNA que contienela información biológica que codifica para un produc-to de RNA o para un polipéptido, e incluye las regio-nes que están implicadas en regular su transcripción ytraducción. Sin embargo, en una región genómica,pueden ser transcritas ambas cadenas de la moléculadel DNA, lo que implica que haya genes traslapadoscon direcciones opuestas de transcripción. Por otraparte, debido a que en una misma cadena puedenemplearse varios ORF generando diferentes productosy al uso alternativo de exones, entre otros mecanis-mos, los genes humanos por lo común codifican paravarios productos funcionales, que pueden ser ncRNA,polipéptidos o ambos. Por ello, la definición de gendebe permanecer como un término flexible y adaptar-se a los nuevos datos científicos.

ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS: DNA Y RNA

Las moléculas de DNA y RNA están formadas por cadenasde polinucleótidos unidos por enlaces fosfodiéster y cadanucleótido consta de una base nitrogenada, un azúcar y ungrupo fosfato. Las bases nitrogenadas son derivadas de lapurina, adenina (A) y guanina (G) o de la pirimidina, cito-sina (C), timina (T) y uracilo (U). Las cuatro primeras seencuentran en el DNA, y la timina es reemplazada por eluracilo en el RNA. Las bases nitrogenadas se unen con unapentosa formando un nucleósido. En el RNA, el azúcar esla ribosa y en el DNA es la 2’-desoxiribosa. Los átomos delos anillos de las pentosas se designan con números primospara distinguirlos de los de las bases. La unión entre la basey el azúcar es un enlace N - glucosídico, que se estableceentre el N1 de las pirimidinas o el N9 de las purinas y laposición 1’ de la pentosa. Los nucleótidos se forman por launión de un grupo fosfato a cada nucleósido en el carbono5 del azúcar. Para formar una cadena de polinucleótidos, elgrupo 5’- fosfato de un nucleótido se une de manera cova-lente formando un enlace fosfodiéster con el grupo 3’-hidroxilo de la pentosa de otro nucleótido. Por lo tanto, unacadena de polinucleótidos tendrá un grupo 5’ -fosfato libreen un extremo y un grupo 3’- hidroxilo libre en el otro. Estopermite determinar la polaridad de cada cadena que puedeir de 5’ ! 3’ ó de 3’ ! 5’ (figura 2-2).

En una célula, por lo general las moléculas de RNAexisten como moléculas de una sola cadena, mientrasque la estructura del DNA es una doble hélice compues-ta por dos cadenas antiparalelas de polinucleótidos. Laestructura tridimensional de la doble hélice del DNA fuepropuesta en 1953 por J. Watson y F. Crick. Para ello, sebasaron en tres evidencias fundamentales:

DNA

RNA

Proteína

Ribosomas

DNA

Núcleo

Citoplasma

Exón Intrón5´CAP-

5´CAP-

hnRNA

AAAAAA-3

AAAAAA-3

ProteínaPéptido naciente

5´- -3´

5´CAP- AAAAAA-3mRNA

Recopilación

TranscripciónTranscripción inversa

Replicación

Traducción

Figura. 2-1. Dogma Central de Biología Molecular. Flujo de la información genética en una célula eucarionte.

2 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 3: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases nitrogenadasPurinas

Adenina (A)

Piremidinas

Citosina (C) Timina (T) Uracilo (U)

Doble hélice de DNA

2 desoxirribosa RibosaNucleósido

Nucleoótido

N

N N

NH

O

NH2

NH2

N

N N

NH

H

HN

NO

OCH3

H

NH2

N

H

H

NO O

O

H

H

H N

N

OHOCH2

H

H H

H

H

OH

OH

OHOCH2

H

H H

OH

H

OH

OH

OHOCH2

H

H H

H

H

N

OH

N

H

H

O

NH2

O

H

H H

H

H

N

OH

N

H

H

O

NH2

CH2

R O P OO

O

Complementariedad entre las bases del DNA

N

N

N

N

N

NN

N

H

H

H

H

H

O

O

Guanina Citosina

N

N

N N

NN H

H

O

ON

H

Timina Adenina

5´ 3´

T A

C G

T A

C G

C G

T A

T A

C G

T A

C G

T A

C G

T A

Esqueletoazúcar-fosfato

Paresde bases

0.34 nm

Surco menor

Surco mayor

2.0 nm

3.4 nm

Figura 2-2. Componentes estructurales de los ácidos nuclei-cos y estructura de la doble hélice del DNA.

Bases moleculares de la herencia 3©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 4: Cap 2_Bases Moleculares de La Herencia_Castillo

1. El conocimiento de que la molécula de DNA estabacompuesta de bases nitrogenadas, azúcares y grupos fos-fatos unidos en una cadena de polinucleótidos.

2. Los resultados de los experimentos de E. Chargaff, quedemostraron que en moléculas de DNA de diferentesorganismos, la cantidad de adenina siempre era igual a lade timina y la cantidad de guanina a la de citosina; por loque en una molécula de DNA la cantidad de purinassiempre es igual a la de pirimidinas (reglas de Chargaff).

3. Las fotografías de difracción de rayos X de fibras deDNA, realizadas por R. Franklin y M.Wilkins, que mos-traban que la molécula de DNA estaba organizada enuna estructura helicoidal dextrógira altamente ordenadacon dos periodicidades, una de 0.34 nm y otra de 3.4 nma lo largo de toda la hélice, la cual tenía un diámetroconstante de 2 nm.

En la doble hélice de DNA los azúcares y grupos fos-fatos quedan en el exterior de la molécula, formandoun polianión debido a las cargas negativas de los gru-pos fosfato, mientras que las bases nitrogenadas, denaturaleza hidrofóbica quedan en el interior de lahélice, orientadas paralelas entre sí y perpendicularescon respecto a un eje central de la molécula del DNA.Las cadenas se mantienen unidas por puentes dehidrógeno entre las bases nitrogenadas complementa-rias: A con T mediante dos puentes de hidrógeno y Ccon G formando tres (figura 2-2).

La estructura descrita antes corresponde a la formaB (DNA B), que se encuentra más en las condicionesfisiológicas en las células procariontes y eucariontes.Sin embargo, el DNA puede adoptar diferentes tiposde estructuras dextrógiras dependiendo del grado dehidratación (DNA A, C, D y E). Una forma más, elDNA Z, es la única con giro hacia la izquierda cada 12pares de bases y sólo se forma con una secuencia alter-nada de purina y pirimidina, por lo general GC. ElDNA Z existe en las células en ciertas regiones ricas

en GC. Se han reconocido proteínas que interaccio-nan con estructuras de DNA-Z por lo que éste pare-cería ser un mecanismo más de regulación de laexpresión génica.

Las moléculas de RNA forman estructuras de doblehélice intracadena por apareamiento entre adenina yuracilo, y entre guanina y citosina, generando estructurastallo-asa; estas estructuras se observan en todos los RNA,y son necesarias para que realicen sus funciones. Tambiénel RNA puede aparearse con el DNA (como ocurredurante la transcripción) o con una segunda molécula deRNA (p. ej., durante la remoción de intrones). En algu-nas regiones del genoma, como en una pequeña regióndel DNA mitocondrial (mtDNA) humano o en los teló-meros de los cromosomas humanos, las moléculas deDNA pueden formar estructuras de triple hélice, forma-das por tres cadenas de polinucleótidos. De manera adi-cional pueden encontrarse apareamientos no usualesentre las bases nitrogenadas como los cuartetos de gua-nina o apareamiento de Hoogsteen presentes en los teló-meros humanos.

ESTRUCTURA Y ORGANIZACIÓN DELGENOMA HUMANO

De todos los genomas existentes, el nuestro es el quereviste una mayor relevancia e interés en el área de lagenética médica. El genoma humano está compuestopor dos genomas: un genoma nuclear complejo queconstituye 99.9995% de la información genética totaly un genoma mitocondrial simple que aporta el0.0005% restante. El genoma nuclear haploide estáconstituido por 3200 Mb (mega bases) y cada una delos 13 millones de células que componen el cuerpohumano contiene básicamente la misma secuencia denucleótidos (cuadro 2-1).

Cuadro 2-1. Características principales del genoma nuclear y mitocondrial humanoCaracterística

TamañoN° de moléculas de DNA diferentesN° total de moléculas por célulaProteínas asociadas

N° de genes que codifican para proteínasN° de genes para ncRNADensidad génicaDNA repetitivoTranscripción

IntronesPorcentaje de DNA que codifica paraproteínas

Uso de codones

Recombinación

Herencia

Genoma mitocondrial16.6 kbUna molécula DNA circularVarios miles (varía por tipo celular)Casi libre de proteínas

13241/0.45 kbMuy pocoTranscritos multigénicos se producen deambas cadenas, pesada y ligeraAusentes~ 66%

60 codones para aminoácidos y 4 codonesde alto UAG, UAA, AGA y AGGNo evidente

Exclusivamente materna

Genoma nuclear3.1 Gb23 (células XX) o 24 (células XY)46 en células diploide, 23 en gametosVarias clases de proteínas histonas y nohistonas~ 21,000Desconocido, actualmente ~ 6,000~ 1/120 kb, no conocido> 50 % del genoma Transcripción individual de la mayoría de los genesPresentes en la mayoría de los genes~ 1.1%

61 codones para aminoácidos y 3 codonesde alto UAG, UAA, y UGA Al menos un evento para cada par dehomólogos durante la meiosisMendeliana para los genes en el X yautosomas, paterna para los genes del Y

Gb = 109 pares de bases. kb = 103 pares de bases.

4 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 5: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia 5©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Genoma nuclearEl genoma nuclear humano se encuentra dividido en 24moléculas lineales de DNA de doble cadena, la más cortade 50 Mb y la más larga de 263 Mb, cada una contenidaen un cromosoma diferente. La cromatina es la estructu-ra macromolecular compleja formada por DNA, RNA yproteínas que forma los cromosomas de las células euca-riontes. La eucromatina tiene una estructura relativa-mente descondensada y en ella se encuentran las secuen-cias transcripcionalmente activas, a diferencia de la hete-rocromatina que está altamente condensada y puede serconstitutiva o facultativa. El contenido de pares G-C(G+C) promedio del componente eucromático delgenoma nuclear humano es 41%, sin embargo, existe unavariación considerable entre los cromosomas, desde 38%(G+C) en los cromosomas 4 y 13 hasta 49% (G+C) enel cromosoma 19. La composición de nucleótidos tam-bién varía a lo largo de cada cromosoma, lo que se mani-fiesta con propiedades de tinción diferentes (bandas).Interesantemente, la proporción del dinucleótido CpG,es decir una citosina adyacente a una guanina en lamisma cadena en dirección 5’!3’, se encuentra en elgenoma con una frecuencia cinco veces menor a la espe-rada de acuerdo al contenido de G+C. En el DNA demamíferos, las citosinas de los dinucleótidos CpG estánmetiladas en el carbono 5, produciendo 5-metil citosina(5mC) en ambas cadenas del DNA. A través de la evo-lución la desaminación gradual de los residuos de 5mCllevó al cambio de CpG por TpG, lo que explica su bajafrecuencia. Estos dinucleótidos metilados constituyenpuntos calientes para mutaciones en el genoma humano.En contraste, ciertas regiones del genoma contienen unadensidad mayor de secuencias CpG y reciben el nombrede islas CpG. Éstas por lo general se encuentran en losextremos 5’ (promotor o primer exón) de la mayoría delos genes de mantenimiento celular, tienen un contenidode GC mayor de 50%, abarcan 1 a 2 kb y se encuentrandesmetiladas para permitir la transcripción de los genesadyacentes.

En el genoma humano nuclear la densidad génicavaría considerablemente en las regiones cromosómicas.Esto fue inferido a partir de los patrones de bandas de loscromosomas metafásicos. A continuación, la hibridaciónde fracciones purificadas de islas CpG sobre los cromo-somas corroboró que la densidad génica mayor seencuentra en las regiones subteloméricas, existiendo cro-mosomas ricos en genes como el 19 y el 22, y otrospobres como el 4. 18, X y Y. Estos datos fueron a conti-nuación confirmados por el análisis de la secuencia delgenoma humano.

En la actualidad se asume que el genoma humanonuclear contiene alrededor de 20 000 genes codifican-tes para proteínas (1.1% del genoma nuclear) y almenos 6 000 genes codificantes para moléculas fun-cionales de ncRNA, dando un total de 26 000 genes.Sin embargo, este número debe ser tomado de mane-ra provisional. Es interesante señalar que aunque laporción traducida del genoma es muy pequeña, unaparte importante de él se transcribe, ésta incluye a losintrones de los genes que codifican para proteínas,(alrededor de 26% del genoma) y muchas otrassecuencias cuya función aún se desconoce.

Los genomas eucariontes contienen DNA con secuen-cias de bases que se repiten en grado variable y que vandesde secuencias de copia única, hasta secuencias alta-mente repetitivas. Las secuencias de copia única o debajo número de copias comprenden cerca de 40% delgenoma humano. El resto, corresponde a secuencias deDNA moderada o altamente repetitivas. Éstas puedenencontrarse repetidas en tándem, agrupadas en unaregión particular o dispersas por todo el genoma.

Genes que codifican para polipéptidosLa mayoría de los genes que codifican para cadenas polipep-tídicas se encuentran en las secuencias de copia única. Pocospolipéptidos humanos están codificados por dos o máscopias de un gen. Cuando esto ocurre, con frecuencia estáncodificados por genes que se han duplicado y tienen estruc-turas y funciones similares por la subsecuente divergenciaevolutiva. Algunos se agrupan en regiones cromosómicasespecíficas (clusters), mientras que otros están dispersos en elgenoma constituyendo las familias multigénicas. Éstas pue-den ser de dos tipos: las familias génicas clásicas que mues-tran un alto grado de homología en sus secuencias y funcio-nes, y las superfamilias génicas que tienen una limitadahomología en sus secuencias, pero que están de manera fun-cional relacionadas. Los genes de familias génicas clásicas queproducen proteínas tanto con similitud funcional comoestructural tienden a estar agrupados. Algunos ejemplos sonlos agrupamientos génicos de "-globina en el cromosoma16p y de #-globina en 11p, o la familia génica HOX (home-obox) que consiste en agrupamientos de cerca de 10 genes encuatro cromosomas. Las superfamilias de los genes, que estánrelacionados de manera distante en la evolución, tienden asituarse de manera dispersa en diferentes localizaciones cro-mosómicas. Por ejemplo, los genes que codifican para la insu-lina (cromosoma 11p) y su receptor (19p).

Genes que codifican para moléculas dencRNAAlgunos genes nucleares codifican para moléculas madu-ras de ncRNA con diversas funciones. Entre ellas estánlos que participan en el proceso de la expresión génicaque incluye a los RNA ribosomales (rRNA) y a los RNAde transferencia (tRNA), implicados en la traducción delmRNA. Existen múltiples genes para rRNA, las molécu-las 28S, 18S y 5.8S de los rRNA citoplásmicos estáncodificados en una sola unidad transcripcional que serepite en tándem 250 veces, comprendiendo cinco gru-pos de aproximadamente 50 repetidos localizados en losbrazos cortos (p) de todos los cromosomas acrocéntricoshumanos 13, 14, 15, 21 y 22. El rRNA 5S citoplásmicoestá codificado por varios cientos de copias génicas en 3regiones del brazo largo (q) del cromosoma 1. Los genespara los tRNA pertenecen a una gran familia génica dis-persa que comprende más de 49 subfamilias diferentes,cada una con varios miembros que codifican para lasdiferentes especies de tRNA (cuadro 2-2).

Los ncRNA incluyen a los RNA pequeños nucleares(snRNA) (small nuclear) implicados en especial en elproceso de remoción de intrones, así como a un grannúmero de microRNA (miRNA) y RNA pequeños

Page 6: Cap 2_Bases Moleculares de La Herencia_Castillo

nucleolares (snoRNA) (muchos, sino la mayoría de loscuales aún no han sido identificados), así como tambiénotras clases de RNA pequeños reguladores (< 200 nt), ydecenas de miles de trascritos largos (> 200nt), incluyen-do patrones complejos de transcritos sentido y antisenti-do sobrelapados, de los cuales se ignora su función en lamayoría de los casos y a los que se les conoce como TUF(transcript unknown function). Otros genes codificanncRNA con funciones diferentes, como el RNA 7SL quees un componente de la partícula de reconocimiento delpéptido señal requerido para la exportación de proteínasy TERC que codifica para el componente de RNA de la

telomerasa, la enzima necesaria para la síntesis de DNAen los telómeros. Los ncRNA, incluyendo muchos deri-vados de intrones, parece que componen una plataformaoculta de señales internas que controlan en varios nive-les la expresión génica desde la arquitectura de la croma-tina a la memoria epigenética (Anexo regulación epige-nética y por RNAi).

Seudogenes y genes procesadosExisten secuencias en el genoma que tienen una gransimilitud con genes conocidos, pero que no son funcio-

Cuadro 2-2. Tipos de RNA no codificante (ncRNA) humano y sus funciones

ClaseRNA ribosomal (rRNA)~120 a 5 000 nt

RNA transferencia (tRNA)~70 a 80 nt

RNA pequeño nuclear (snRNA)~60 a 360 nt

RNA pequeño nucleolar (snoRNA) ~60 a 300 nt

ClaseMicroRNA (miRNA) ~22 ntPiwi RNA (piRNA) ~ 24 a 31 nt

RNA pequeños de cuerpos de cajal (scaRNA)RNA pequeño interferente (siRNA)~ 21 a 22 nt

RNA antisentido

FuncionesComponentes en ribosomas de mitocondriasComponentes en ribosomas del citoplasmaUnión a los codones del mRNA mitocondrialUnión a los codones del mRNA citoplásmico

Componentes principales del complejo removedor deintrones y empalmador de exonesComponentes menores del complejo removedor deintrones y empalmador de exonesTerminación transcripción mRNA histonas.

Metilación sitio específica de 2’ OH de rRNAModificación específica de rRNA por formación depseudouridinaProcesamiento de rRNAImplicados en regulación de expresión, incluyendo RNAi

FuncionesRegulación expresión, RNAiDefensa contra transposones en línea germinalprincipalmenteMaduración de ciertas clases de snRNA en cuerpos decajal del núcleoDerivados de pseudogenes y repetidos invertidos,regulación de la expresión génica

Inicio inactivación cromosoma XTranscrito antisentido, apagado de XIST en X activo

Apagado alelo materno de IGF2Apagado de varios alelos paternos

Apagado de genes HOXRegulación de MSX1

Componente de la telomerasa, templado para la síntesisde DNA teloméricoRegulador negativo de la elongación por RNA polimerasa IIComponente de la partícula de reconocimiento (SRP)para el transporte de proteínas de secreción en retículoendoplásmico

Procesamiento de los tRNA nuclearesCo-activador de algunos receptores de esteroidesFamilia transcritos específica de testículo

Ejemplos12S y 16S rRNA28S, 5.8S, 18S y 5S rRNA22 tipos tRNA mitocondriales49 tipos tRNA citoplásmicosMuchos, incluyendoU1, U2, U4, U5 y U6 snRNA

U5, U4atac, U6atac,U11 y U12 snRNA

U7 snRNAMás de 100 tipos diferentes80 snoRNA con caja C/D15 snoRNA con caja H/ACA

U3 y U8 snoRNAMuchos más

Ejemplos~ 1 000 tipos> 15 000

~ 25 tipos

Endógenos >10 000

XIST RNA (19.3 kb)TSIX RNA (37.0 kb)

H19 RNA (2.3 kb)KCNQOT1 (59.5 kb)desconocido > 1500HOTAIR (2.2 kb)Antisentido MSX1

RNA telomerasa (TERC)

7SK RNA7SL RNA

RNasa P SRA1 RNATTY2 RNA

Principales tipos implicados en la expresión génica

Otras clases de ncRNANo codificantes pequeños < 200nt

No codificantes pequeños < 200ntRelacionados con inactivación del cromosoma X

Relacionados con el establecimiento de impronta

Misceláneos ~ 80 a 500 nt

nt= nucleótido.

6 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 7: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia 7©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

nales y que se denominan seudogenes. Estas secuenciasson producto de eventos de duplicación génica, las cua-les adquieren mutaciones en regiones codificantes oregulatorias que las vuelven defectuosas, lo cual resultaen un pseudogén convencional o no procesado. Porejemplo, existe un pseudogén para "-globina y tres de #-globina en sus respectivos agrupamientos. En otros casosexisten varios seudogenes localizados en cromosomasdiferentes, como para el gen NF1 (neurofibromatosistipo 1) del que hay al menos 11 seudogenes distribuidosen cromosomas diferentes, incluso algunos de ellos loca-lizados en regiones pericentroméricas. Otras copias géni-cas defectuosas pueden tener sólo algunas porciones delas secuencias génicas, algunas veces un solo exón, y sedescriben como fragmentos génicos. De manera alterna-tiva, existen seudogenes procesados, los cuales quizá seoriginaron por la inserción en el genoma de secuenciasde DNA complementario o copia (cDNA) producidaspor la acción de la transcriptasa inversa sobre un mRNAtranscrito a partir de un gen funcional (retrotransposi-ción). Al provenir de moléculas de cDNA los seudogenesprocesados carecen de intrones. Debido a que la reinser-ción de los seudogenes procesados ocurre en posicionesal azar, rara vez se encuentran dentro de agrupamientosde familias multigénicas por lo que por lo general estándispersos en el genoma. Es interesante señalar que enalgunos casos este proceso ha generado genes procesa-dos o retrogenes que mantienen un ORF funcional y quepueden expresarse por poseer promotores internos oquedar bajo el control de secuencias en la zona de inser-ción. Un ejemplo de retrogén es el gen SRY del cromo-soma Y responsable de la diferenciación testicular enmamíferos, cuyo homólogo en el cromosoma X, SOX3,si presenta intrones. Es importante señalar que aunquelos seudogenes y los seudogenes procesados no tengan unproducto proteico funcional, una proporción significati-va de ellos se transcribe, y aun cuando esto no es sufi-ciente para indicar si tienen una función biológica signi-ficativa, los datos actuales muestran que esta transcrip-ción se realiza en un nivel bajo y con un patrón específi-co de tejido o línea celular, lo cual podría generar ncRNAfuncionales.

DNA no codificante altamente repetidoEl genoma humano nuclear contiene una gran cantidadde familias de secuencias altamente repetidas. Al igualque las familias multigénicas, el DNA repetitivo no codi-ficante muestra dos tipos principales de organización:repetido en tándem y repetido disperso (cuadro 2-3).

DNA no codificante repetido en tándem. Las secuen-cias de DNA repetidas en tándem consisten en bloquesde DNA no codificante que tienen una localización pre-cisa en el genoma. Este tipo de secuencias se puedensubdividir en tres clases de acuerdo a su extensión y altamaño de la unidad de repetición: DNA satélite, mini-satélite y microsatélite (cuadro 2-3).

Cuando se fracciona el DNA por sedimentación en ungradiente de densidad, las secuencias altamente repetidasen tándem forman bandas satélites con respecto a lospicos principales del DNA genómico. Este DNA seconoce como DNA satélite y está formado por series lar-gas de cientos de kilobases (kb) de repetidos en tándem

de 5 a 171 pb. La mayor parte del DNA satélite se loca-liza en los centrómeros de todos los cromosomas (hete-rocromatina constitutiva pericentromérica), por lo quese ha sugerido que tenga una función estructural. Otrostipos de secuencias de DNA satélite no pueden ser iden-tificados mediante centrifugación en gradientes de den-sidad. Se identificaron al inicio por la digestión de DNAgenómico con una endonucleasa de restricción que típi-camente tiene un sitio de reconocimiento en la unidadde repetición básica de 171pb presente en todos los cen-trómeros humanos. Estas secuencias alfa satélite o DNAalfoide constituyen la mayor parte de la heterocromati-na centromérica, existiendo por divergencia evolutivasecuencias específicas de cada cromosoma.

El DNA minisatélite comprende dos familias desecuencias cortas de DNA: la telomérica y la hipervaria-ble. Las secuencias repetidas teloméricas son necesariaspara mantener la integridad de los cromosomas durantela replicación y son añadidas por una enzima especializa-da denominada telomerasa. Además actúan protegiendode degradación y pérdida de material genético a losextremos de los cromosomas y son responsables de lafunción de los telómeros (Anexo Telómero). El DNAminisatélite hipervariable se localiza por lo común enregiones subteloméricas, aunque también se halla enotras regiones del genoma incluidos intrones, y es alta-mente polimórfico por lo que utiliza para la identifica-ción de individuos (huellas de DNA) (Anexo Variacióngenética humana). Las secuencias de DNA microsatélitese localizan a lo largo de todo el genoma, también sonaltamente polimórficas y se utilizan como marcadoresgenéticos en estudios de evolución, ligamiento génico yhuellas de DNA (anexo variabilidad humana). Algunosse encuentran en regiones intragénicas y sus variacionesse asocian con la etiopatogenia de un grupo de padeci-mientos conocidos como enfermedades por amplifica-ción de microsatélites (Anexo Mutación y enfermedad).

DNA no codificante repetido disperso. En el genomahumano también se encuentran secuencias de DNA nocodificante altamente repetido que se encuentran dispersasen todo el genoma y que se denominan repetidos dispersoso interespaciados. La mayor parte de este tipo de repetidoshan derivado de transposones (secuencias de DNA móvilesque pueden migrar a diferentes regiones del genoma) y seha reconocido que más de 40% del genoma humano perte-nece a esta clase. Con base en la forma de transposición sepueden clasificar en dos grupos: retrotransposones y trans-posones de DNA (cuadro 2-3).

El mecanismo de transposición en los retrotransposo-nes o retroposones es similar al que genera seudogenesprocesados y retrogenes: una trasncriptasa inversa con-vierte al transcrito de RNA del retrotransposón en uncDNA que se integra en diferentes posiciones del DNAgenómico, generando nuevas copias del mismo. Tres cla-ses de transposones de humanos utilizan este mecanismode copia y pegado: los elementos nucleares interespacia-dos largos, LINE (Long Interspersed Nuclear Elements),los elementos nucleares interespaciados cortos, SINE(Short Interspersed Nuclear Elements), y los elementostipo retrovirus que contienen repetidos terminales lar-gos, retrotransposones LTR (Long Terminal Repeats). Losretrotransposones pueden ser autónomos o no autóno-mos. Por otro lado, los transposones de DNA migran de

Page 8: Cap 2_Bases Moleculares de La Herencia_Castillo

manera directa sin necesidad de copiar la secuencia: lasecuencia se escinde y se reinserta en otro sitio del geno-ma (mecanismo de corte y pegado o conservativo).

El tipo más común de la familia LINE son las secuen-cias LINE1 o L1. En humanos, esta familia es la únicaque continúa teniendo miembros activos que contienendos ORF. El ORF1 (1kb) codifica para una proteína deunión a RNA (P40) y el ORF2 (4kb) codifica para unaproteína con un dominio de endonucleasa y otro domi-nio de transcriptasa inversa; ambos transcritos provienende un promotor interno en el UTR 5’. La familia ALU esla más prominente de las SINE, el nombre de esta fami-lia se debe a que fue originalmente identificada median-te la enzima de restricción AluI. Estas secuencias se ori-ginaron por un evento de retrotransposición del gen quecodifica para el RNA 7SL y que retuvo el promotorinterno para la RNA polimerasa III. Estas secuencias setranscriben activamente aun cuando carecen de unmarco de lectura abierto. Los miembros de la familia Aluestán flanqueados por secuencias repetidas directas de 6a 18 pb, por lo que se asemejan a los transposones clási-cos de DNA. Tanto los repetidos Alu como los LINE1

pueden promover eventos de recombinación homólogano alélica, lo cual lleva a duplicaciones, deleciones oinversiones que conducen a mutaciones patogénicas, oque proveen una ventaja selectiva en la evolución. Estoseventos de recombinación anormales pueden ocurrirtanto intra como intercromosomas (Anexo Mutación yenfermedad).

Genoma mitocondrialEl genoma mitocondrial humano está definido por unsolo tipo de molécula de DNA circular cerrada cuyasecuencia completa de nucleótidos fue establecida en1981. Tiene 16, 569 bp y 44% de G + C. Las dos cade-nas tienen una composición de bases diferente: la cade-na pesada (H) es rica en guaninas y la cadena ligera (L)en citosinas. A pesar de que el genoma mitocondrial esbásicamente de doble cadena existe una pequeña regiónen la cual es de triple hélice. Esto es debido a que un seg-mento corto de la cadena pesada es replicado en unsegundo tiempo, dando una estructura conocida comoDNA 7S o asa de desplazamiento (asa D). Las células

Cuadro 2-3. Principales clases de DNA humano altamente repetidoSecuencias repetidas en tándem (~7% del genoma nuclear humano)

Clase

DNA satélite" (DNA alfoide)# (familia Sau3A)Satélite 1

Satélite 2

Satélite 3DYZ19DYZ2DNA minisatéliteTeloméricoHipervariable

DNA microsatélite

Clase

LINE

Familia L1Familia L2Familia L3SINE

Familia AluMIRMIR3Transposones LTRFamilias HERVMaLRTransposones DNAMER1 (Charlie)MER2 (Tigre)Otros (ej. marino)

Tamaño de la unidad repetida

5 a 171 bp171 bp68 bp25 a 48 bp (rico A a T)

Formas divergentes de ATTCC/GGAATATTCC/GGAAT125 pbRico en A a T

TTAGGG9 a 64 bp

1 a 4 bp

N° de copias en elgenoma (%)

~ 1 000 000 (20%)

~ 600 000 (17%)~ 370 000~ 44 000~ 1 750 000 (13%)

~ 1 200 000 (12%)~ 450 000~ 85 000~ 600 000 (9%)~ 240 000 (4.6%)~ 285 000 (4%)~ 330 000 (3%)~ 213 000~ 68 000~ 60 000

Localización cromosómica

Asociado con heterocromatina constitutivaHeterocromatina centromérica de todos los cromosomasHeterocromatina centromérica del 1, 9, 13, 14, 15, 21, 22, YHeterocromatina centromérica de la mayoría de los cromosomas y otras regiones heterocromáticasLa mayoría, posiblemente todos los cromosomas

Brazos p acrocéntricos y heterocromatina en 1q, 9q y Yq12~ 400 kb en Yq11Yq12, periodicidad mayor de ~ 2470 bpEn o cerca de todos los telómerosTodos los telómerosTodos los cromosomas, regiones eucromáticas, ynotablemente en regiones subteloméricasAmpliamente distribuido a lo largo de todos los cromosomas

Localización cromosómica

Preferencialmente en bandas G oscuras, regiones ricas en A a T

Preferencialmente en bandas G claras, regiones ricas enG a C

Dispersas en todos los cromosomas

Dispersas en todos los cromosomas

Tamaño (% del genoma)

Cientos de kb (6.5%)

0.1 a 20 kb

< 100 bp

Tamaño

6 a 8 kb

100 a 400 bp

1.5 a 11kb6 a 11 kb1.5 a 3 kb80 bp a 3 kb

bp= pares de bases. kb= kilo pares de bases.

Secuencias repetidas dispersas (~45% del genoma nuclear humano)

8 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 9: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia 9©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

humanas por lo regular contienen miles de copias de lamolécula de DNA mitocondrial, mtDNA. A pesar deque la molécula de mtDNA es sólo 1/8 000 de un cro-mosoma, en una célula nucleada humana el genomamitocondrial constituye 0.5% del DNA total. En ovoci-tos maduros existen más de 100 000 copias del DNAmitocondrial, por lo que en este caso comprende la ter-cera parte del contenido del DNA celular total.

Al contrario de lo que ocurre con el genoma nuclearhumano, 93% del mtDNA corresponde a secuencias conproductos funcionales. Contiene 37 genes, de ellos, 24codifican para ncRNA: 22 moléculas de tRNA y dosmoléculas de rRNA, uno 16S (componente de la subu-nidad grande del ribosoma mitocondrial) y otro 12S(componente de la subunidad pequeña del ribosomamitocondrial). Los 13 genes restantes codifican para 13polipéptidos que forman parte de los complejos mul-tienzimáticos de la fosforilación oxidativa (sistemaOXPHOS): 7 subunidades del complejo I (NADH des-hidrogenasa), 1 subunidad del complejo III (citocromob), 3 subunidades del complejo IV (citocromo oxidasa)y 2 subunidades del complejo V (ATP sintasa) que sonsintetizadas en los ribosomas mitocondriales. El resto delas proteínas mitocondriales, incluyendo la DNA pol[[$]], RNA pol, proteínas ribosomales y de los comple-jos de fosforilación oxidativa, están codificadas en elgenoma nuclear y son traducidas en los ribosomas cito-plasmáticos para a continuación ser importadas por lamitocondria. En la cadena H del mtDNA se encuentran28 genes (2 rRNA, 14 tRNA y 12 polipéptidos) y losnueve restantes en la L. En ambas cadenas, los genes delos tRNA están distribuidos entre los genes rRNA o codi-ficantes de proteínas, lo cual es de gran importancia parael procesamiento del RNA mitocondrial. El código gené-tico mitocondrial es usado para descifrar sólo 13 mRNAy difiere ligeramente del código genético nuclear; esdecir, se pierde su universalidad en algunos tripletes, porejemplo, UGA codifica para triptofano, en lugar de serseñal de paro, como lo es en el código nuclear.

La única región del genoma mitocondrial que real-mente carece de una secuencia codificante es la regióndel asa D. La replicación de las cadenas pesada y ligera esunidireccional y comienza en orígenes específicos. En elprimer caso, el origen es el asa D y hasta que se han sin-tetizado alrededor de dos terceras partes de esta cadena,queda expuesto el origen de la cadena ligera y puedecomenzar su síntesis. La transcripción de los genes mito-condriales, a diferencia de los nucleares, se inicia en pro-motores presentes en el asa D y continúa en direccionesopuestas para las dos cadenas, recorriendo el círculo ygenerando transcritos multigénicos. Los RNA madurosson generados subsecuentemente por el corte de lostranscritos policistrónicos, aprovechando las secuenciasde los tRNA.

El mtDNA tiene una tasa de mutación mucho másalta que el genoma nuclear. Es más susceptible de sufrircambios en su secuencia de nucleótidos y además existenmecanismos que permiten su fijación rápida. Esto últimoparecería ocurrir por un mecanismo en cuello de botelladebido a la reducción en el número de mitocondrias enla célula germinal femenina, 100 a 500 y su posteriorproliferación en el ovocito maduro. Este mecanismoparecería ser el responsable de que fije mutaciones 10

veces más rápido que el genoma nuclear, aun cuando norealice recombinación homóloga como un mecanismoobligatorio.

Se ha postulado que la alta inestabilidad del mtDNAes resultado de varios factores, entre los que destacan: elalto índice de producción de intermediarios de oxígenoreactivo, a partir de la cadena respiratoria, capaces deproducir daño oxidativo al genoma mitocondrial despro-visto de histonas; el hecho de que el genoma mitocon-drial se replique más que el nuclear. La mitocondriacuenta con mecanismos análogos a los que operan en elnúcleo para la reparación de las lesiones producidas porexposición a oxidantes o a diversos fármacos. Estos inclu-yen a todos los sistemas de reparación, incluyendo lamaquinaría para la recombinación homóloga, sin embar-go carece de los componentes del sistema de reparaciónpor escisión de nucleótidos. La capacidad del genomamitocondrial para fijar mutaciones rápidamente, aunadaa su mecanismo de herencia permitió realizar estudiosevolutivos. El trabajo de Wilson et al., estudiando lasvariaciones en la secuencia del genoma mitocondrial endiversos grupos humanos, sugiere fuertemente que elDNA mitocondrial de todos los grupos humanos moder-nos desciende de una secuencia ancestral única prove-niente de una mujer que vivió hace alrededor de 200000 años en el centro de África. Aplicando una metáfo-ra bíblica, la prensa bautizó a esta teoría como la “EvaAfricana” (Anexo Variabilidad mtDNA).

REPLICACIÓN

La molécula de DNA debe duplicarse para que al divi-dirse la célula cada descendiente reciba la misma infor-mación genética; a este mecanismo se le conoce comoautoduplicación o replicación. Para el inicio de la síntesisde DNA, las dos cadenas de una molécula deben serseparadas. Cada cadena sirve como molde o templadopara que las DNA polimerasas (DNA pol) sinteticennuevas cadenas de DNA complementarias, utilizando loscuatro deoxinucleósidos trifosfatados (dATP, dCTP,dGTP y dTTP) y a partir de la liberación de pirofosfatoobtienen la energía necesaria para formar los enlaces fos-fodiéster de la molécula en crecimiento. Las moléculashijas se forman por una cadena de la molécula original yuna recién sintetizada. Este mecanismo se denominasemiconservativo y fue demostrado de forma experi-mental por Meselson y Stahl en 1958.

La replicación del DNA se inicia en una secuenciaespecífica llamada origen de replicación (oriC en E. coli),a partir de la cual procede en forma bidireccional y cons-tituye un replicón. Debido a la enorme cantidad deDNA, en el genoma humano existen múltiples replico-nes. A partir de cada uno se forma una horquilla en lacual la replicación prosigue en forma bidireccional y ter-mina donde se encuentra con la horquilla del siguientereplicón. La replicación se realiza durante la fase S delciclo celular, los replicones en la eucromatina inicianantes que los replicones en la heterocromatina; los repli-cones en o cerca de genes activos inician antes que losreplicones en regiones inactivas. Las secuencias de losorígenes de replicación en eucariontes no están bien

Page 10: Cap 2_Bases Moleculares de La Herencia_Castillo

definidas a excepción de los de levaduras denominadosARS (por su nombre en inglés autonomously replicatingsequences in S. cerevisiae). La distribución en el genomahumano de los orígenes de replicación está asociada a lociespecíficos localizados por lo general en genes que desdeel punto de vista transcripcional activos, codificantescomo los de #-globina, MYC o DNMT1 (DNA methyl-transferase 1) o no codificantes como los de rRNA. Laexpresión génica permite establecer dominios en la cro-matina para que se establezcan las condiciones epigené-ticas necesarias para determinar su empleo como oríge-nes de replicación.

En general, todas las células eucariontes hacen sólouna copia precisa de cada uno de sus cromosomas encada vuelta del ciclo celular. Esto significa que cada ori-gen de replicación debe activarse sólo una vez por cicloy para ello se ensamblan complejos pre-replicativos enlos orígenes de replicación, los cuales sólo podrán seractivados in situ en la fase S. Estos complejos incluyen unheterohexámero formado por las proteínas ORC1-6(origin replication complex 1-6) que se ensambla al finalde la fase M y al que detrás se unen las DNA helicasasreplicativas al final de la fase G1. Este complejo de heli-casa es un hetero-hexámero formado por seis proteínasrelacionadas MCM2-7 (minichromosome maintenance 2-7), el cual para poder unirse requiere de otras proteínascomo CDT1 (chromatin licensing and DNA replicationfactor 1) y CDC6 (cell division cycle 6) que forman partede los complejos prerreplicativos de G1. La activación deMCM2-7 en los orígenes de replicación requiere, entreotras, de la cinasa CDC7 (cell division cycle 7) e implicael reclutamiento de muchos otros factores a los orígenesde replicación. Recién se describieron mutaciones encomponentes de los complejos prerreplicativos (ORC1,ORC4, ORC6, CDT1 y CDC6) asociadas con el síndro-me de Meier-Gorlin (MIM 224690), un tipo de enanis-mo autosómico recesivo, con rótula ausente o hipoplási-ca y orejas muy pequeñas. La apertura inicial de la doblehélice del DNA permite el establecimiento de dos hor-

quillas de replicación con direcciones opuestas en dondepodrán actuar las DNA polimerasas (figura 2-3).

Los DNA pol catalizan la adición de nuevos nucleóti-dos al extremo 3’ OH de la cadena en crecimiento, porlo que en ambas cadenas la síntesis siempre procede endirección 5’!3’. La síntesis es continua en la cadena deDNA que utiliza como molde a la orientada en la direc-ción 3’!5’ y se le denomina cadena líder; mientras quela síntesis es discontinua en la cadena que usa como tem-plado a la cadena complementaria 5’!3’ y se conocecomo cadena rezagada. Como resultado de esto la repli-cación es un proceso semidiscontinuo. Los segmentos deDNA sintetizados de forma progresiva durante la sínte-sis de la cadena rezagada son llamados fragmentos deOkazaki, en E. coli éstos abarcan de 2 000 a 3 000 nucle-ótidos y en los eucariontes de 100 a 200 nucleótidos(figura 2-3).

Existen cerca de 20 tipos diferentes de DNA pol enlas células de mamíferos, la mayoría utilizan DNA comomolde para sintetizar DNA y pertenecen a 4 familias. Lareplicación del DNA nuclear requiere de las DNA pol ",% y &, mientras que el mtDNA es replicado por la DNApol $, el resto de estas enzimas participa en especial enprocesos de reparación del DNA (cuadro 2-4). La DNApol " es la única que posee la habilidad de iniciar unanueva cadena de DNA, tanto en la cadena líder como enla rezagada; el resto requiere de una región de doblecadena con un extremo 3’ OH libre. La DNA pol "forma parte del complejo DNA pol "/primasa que con-siste de la subunidad catalítica (DNA polimerasa) y otras3 subunidades: la subunidad B, necesaria para el ensam-blado y dos subunidades pequeñas que confieren la acti-vidad de primasa (RNA polimerasa). La cadena pequeñade RNA-DNA (10 nt y 20 a 30 nt, respectivamente)producida por el complejo primasa/DNA pol " se deno-mina cebador y es necesaria para iniciar la replicación dela cadena líder y de cada uno de los fragmentos deOkazaki de la cadena rezagada. El complejo DNA pol"/primasa es precedido por el complejo MCM, y las pro-

Dirección de crecimiento

5´Topoosomerasas I y II

MCM2-7

DNA pol !/ primasa

RPA

RFC/PCNA

Síntesis discontinua RPA

FEN1

DNA ligasa I 5´3´

Cadena rezagada

ComplejoDNA pol "

Complejo DNA pol #Cebador

RPA RPASíntesis continua

PCNA/RFC

Cadena líder5´3´

Figura 2-3. Avance de una horquilla de replicación. Se muestran los complejos proteícos y actividades enzimáticas que actúan en las célulashumanas. El origen de replicación de este replicón se encuentra a la derecha de la figura y a partir de ese punto, cuando el complejo MCM2-7 es reclutado por los complejos pre-replicativos ORC1-6 y activado, la replicación procede en forma bidireccional, con cada horquilla avan-zando en dirección opuesta.

10 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 11: Cap 2_Bases Moleculares de La Herencia_Castillo

teínas de unión a cadena sencilla (RPA, replicating prote-ína A) que mantienen las cadenas separadas; formando elprimosoma.

De manera adicional, el desenrollamiento de la doblehélice es facilitado por la acción de las topoisomerasas.Estas enzimas pueden cortar una sola cadena del DNA(topoisomerasas I) o doble cadena (toposisomerasas II)para liberar la tensión generada y evitar el superenrolla-miento. Asimismo las toposisomerasas pueden aumentarlos giros de la doble hélice para generar superenrolla-miento. Una vez formados los cebadores, el primosomaes reemplazado por las enzimas que alargan la cadena, enla cadena líder actúa la DNA pol & y en la rezagada laDNA pol %. Las DNA pol de la familia B, excepto la " y', pueden remover nucleótidos del extremo 3’ por lo queademás tienen actividad de exonucleasas 3’ !5’, lo queles confiere capacidad de edición para quitar bases malapareadas y aumentar la fidelidad de la replicación.

La DNA pol & es una enzima con una alta eficiencia enel proceso de incorporación de nucleótidos, que requierepara ello de la interacción con otras dos proteína, PCNA(proliferating cell nuclear antigen, por razones históricas) yRFC (replication factor C) que forman una abrazadera des-lizante para la polimerasa y la anclan a la horquilla de repli-cación. De manera similar, la DNA pol % forma también uncomplejo de elongación con PCNA y RFC para continuarla síntesis en la cadena rezagada. Cuando el complejo deelongación encuentra el extremo 5’ de fragmento deOkazaki (RNA) la síntesis de la cadena lo desplaza crean-

do una estructura tipo alerón (flap) en 5’, sobre la cualactúa la endonucleasa FEN1 (flap endonuclease-1) liberan-do el cebador. La DNA ligasa I forma el enlace fosfodiésterentre el extremo 3’- OH recién sintetizado y el 5’-P gene-rado por el corte (cuadro 2-5).

Existen otras helicasas, que pertenecen a la familiaRECQ, que permiten abrir estructuras complejas que segeneran durante la replicación, en especial en la cadenarezagada, como la helicasa BLM (mutada en el síndromede Bloom) (MIM 210900) y la helicasa WRN (mutadaen el síndrome de Werner) (MIM 277700), entre otras.Ésta última también participa en la apertura de los cuar-tetos de guanina presentes en los telómeros. Las horqui-llas de replicación avanzan a lo largo de los genomas line-ales, por lo general sin ningún impedimento y de mane-ra eventual la replicación alcanza el extremo de la molé-cula o se encuentra una segunda horquilla de replicaciónmoviéndose en dirección opuesta. En eucariontes, tam-poco existen secuencias terminadoras homólogas a las delas bacterias. Es posible al alcanzar la horquilla en posi-ciones al azar, en que se encuentra con la siguiente, la ter-minación simplemente implica el ligamiento de losextremos.

Una consecuencia de que las DNA polimerasas sólopuedan extender los cebadores en dirección 5’! 3’ esque son incapaces de copiar los extremos 5’ de los cro-mosomas lineales. Este problema es resuelto por la enzi-ma telomerasa quien extiende la síntesis de la cadenalíder. Esta enzima tiene actividad de transcriptasa rever-

Cuadro 2-4. Características de las DNA polimerasas humanasDNA polimerasa dirigidas por DNADNA polimerasa" (alfa)

# (beta)$ (gamma)% (delta)

& (épsilon)

' (zeta)( (eta)) (teta)

* (iota)

+ (kappa), (lambda)µ (mu)- (nu)

REV 1TDT

CaracterísticasForma parte del primosoma

Alta fidelidad en la reparaciónActividad exonucleasa 3’ 5’Actividad exonucleasa 3’ 5’

Actividad exonucleasa 3’ 5’

Propensa a errorLibre de error en dímeros TTHipermutación somática

Propensa a errorSe requiere en meiosisPropensa a errorPropensa a error

Propensa a error

Propensa a errorTransferasa terminal dedeoxinucleótidos

Función en replicación y/o reparaciónInicia la síntesis en los orígenes de replicación y de los fragmentosde Okasaky en la cadena retrasadaSíntesis en reparación por escisión de basesSíntesis y reparación del DNA mitocondrialPrincipal polimerasa en la síntesis de la cadena rezagada, múltiplesfunciones en reparación, incluyendo por escisión de nucleótidos

Síntesis de la cadena líder, múltiples funciones en reparación,incluyendo por escisión de nucleótidosSíntesis sobre lesiónSíntesis sobre lesiónProbable en reparación de enlaces cruzados entre las cadenas del DNA, reparación por escisión de bases, síntesis sobre lesiónSíntesis sobre lesión, probable en reparación por escisión debases y de bases mal apareadasSíntesis sobre lesión, reparación por escisión de nucleótidosReparación por escisión de base, rupturas de doble cadena y recombinación VDJProbable en reparación de enlaces cruzados entre las cadenasdel DNASíntesis sobre lesiónRecombinación VDJ

FamiliaB

XAB

B

BYA

Y

YXXA

YX

DNA polimerasas dirigidas por RNA (Transcriptasas Reversas)Retrotranscriptasas de elementos LINE-1 o de elementos retrovirales endógenos

Telomerasa (TERT)

La mayoría se encuentran silenciadas

Utiliza un templado interno de RNA (TERTC)

Ocasionalmente convierten mRNA y otrosRNA en cDNA, los cuales pueden integrarseen cualquier sitio del genomaReplica el DNA de los extremos de loscromosomas lineales para evitar suacortamiento

*Recombinación VDJ: rearreglos en genes de inmunoglobulinas.

Bases moleculares de la herencia 11©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 12: Cap 2_Bases Moleculares de La Herencia_Castillo

sa y está formada por dos componentes: uno de natura-leza proteica llamado TERT que presenta la actividad detranscriptasa reversa y otro de RNA denominado TERC,que sirve como plantilla para la síntesis de novo del hexa-nucleótido repetido en la secuencia telomérica. Enausencia de actividad de telomerasa los telómeros seacortan después de cada ciclo de replicación (AnexoTelómero y telomerasa).

Es importante recordar que en las células eucariontes elDNA se encuentra en forma de cromatina, por lo que real-mente la replicación implica la duplicación de esta estruc-tura durante la fase S del ciclo celular. Los nucleosomas sondesplazados hacia una u otra cadena durante el avance dela horquilla de replicación y rápidamente se incorporanhistonas recién sintetizadas, las cuales llegan a la cadena deDNA por la acción de chaperonas como CAF1 (chromati-ne assembly 1) y ASF1 (antisilencing function 1) las cualesinteractúan con PCNA y permiten la incorporación de losdímeros de H3 y H4 para el ensamblado de los nuevosnucleosomas. El ensamblaje de los nuevos nucleosomastermina con la asociación de dos dímeros de H2A y H2B,mediada por NAP1 (nucleosome assembly protein 1), con-servándose las modificaciones presentes en los nucleoso-mas de la molécula progenitora por acción de las enzimasque generan las modificaciones postraduccionales de lashistonas y manteniendo el estado epigenético (AnexoRegulación epigenética).

MUTACIÓN Y REPARACIÓNEl DNA es una molécula estable que tiene la capacidadde mantener la información genética. Los trastornos quese producen por lo general son corregidos a través dediferentes mecanismos de reparación; no obstante, pue-den generarse cambios estables en la secuencia de nucle-ótidos, proceso conocido como mutación. Las mutacio-nes se producen por dos mecanismo principales: trastor-nos químicos de las bases que llevan a la incorporaciónde nucleótidos erróneos, o por errores en la replicación yreparación del DNA que se traducen en la incorporaciónincorrecta de un nucleótido o en pérdida o adición denucleótidos. Cuando se presenta el cambio de un nucle-ótido por otro, mutación puntual, si una purina es reem-plazada por otra purina o una pirimidina por otra pirimi-dina, este cambio se conoce como transición, mientras

que si una purina es reemplazada por una pirimidina oviscevera se genera una transversión.

Los agentes físicos (rayos ultravioleta, X, gamma,entre otros), químicos (agentes alquilantes, oxidantes,entre otros) y biológicos (virus, transposones, entreotros) son capaces de producir mutaciones. Contra ellos,las células tienen diversos sistemas de protección: lasmembranas celular y nuclear, la agrupación de genes encromosomas y sistemas enzimáticos donde los mutáge-nos son destruidos antes de que lesionen al DNA. Encaso de que éste resulte dañado todavía existen procesoscapaces de repararlo de una manera exacta, permitiendorecuperar su estructura original. De forma contraria, si eltipo y la cantidad de alteraciones fueran tan graves quelos mecanismos protectores resulten insuficientes se pro-duce muerte celular. Los trastornos en el DNA, que noson reparados ni provocan muerte celular, originan unamutación directa. Por otra parte, el DNA puede ser repa-rado en forma inexacta, con lo que se establece unamutación indirecta. Es importante señalar que mientrasalgunas mutaciones son deletéreas, otras por el contrarioresultan benéficas y permiten que haya variabilidad yselección natural, lo que conduce a cambios evolutivos.

Los cambios en la secuencia de nucleótidos puedenproducirse en regiones codificantes y no codificantes delos genes y en las regiones intergénicas del genoma. Lasconsecuencias de los cambios en la secuencia de nucleó-tidos serán diferentes dependiendo de dónde ocurran y siafectan o no la función de los genes. En genética médicapor lo general se utiliza el término mutación para definirlos cambios que afectan la función de los genes y alteranel fenotipo o producen enfermedad (Anexo Mutación yenfermedad), mientras que se utiliza el término polimor-fismo para hacer referencia a los cambios heredables enla secuencia de nucleótidos que no producen enferme-dad y constituyen parte de la variación normal entre losindividuos (Anexo Variación genética humana). Dadoque los polimorfismos constituyen cambios estables en elgenoma, su frecuencia debe ser de al menos 1% en lapoblación, esto para confirmar que es parte de la varia-ción normal y que no se trate de una mutación de novo.

En la figura 2-4 se muestra el efecto de una mutaciónpuntual y de la inserción de un nucleótido en un ORF. Siel cambio generado por una transición cae dentro de laredundancia del código genético, este cambio se denomi-na mutación silenciosa o sinónima y por lo general se

Cuadro 2-5. Funciones requeridas en las horquillas de replicación de E. coli y mamíferosFunción

Complejos pre-replicativosAnclaje de la helicasa/ primasaDNA HelicasaMantenimiento cadena sencillaSíntesis del cebadorAbrazadera deslizante de la polimerasaAncla de la abrazadera (ATPasa)Síntesis DNADimerización de la holoenzimaRemoción del cebador Unión de fragmentos

MamíferosORC1-6

CDT1/CDC6Complejo MCM2-7

RPADNA Pol "/ primasa

PCNARFC

DNA Pol % + DNA Pol &?

FEN1DNA Ligasa 1

E. coli-

DnaCDnaBSSBPDnaG#

Complejo $%Núcleo de la DNA Pol III

.DNA pol I

DNA Ligasa

12 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 13: Cap 2_Bases Moleculares de La Herencia_Castillo

considera un polimorfismo de un solo nucleótido o SNPsinónimo; sin embargo, este cambio puede afectar laestructura del DNA o el mRNA y tener consecuenciasen su función. Cuando una transición o transversiónresulta en un codón que determina otro aminoácido se lellama mutación de sentido erróneo y puede ser conser-vativa o neutra; si un aminoácido es reemplazado porotro del mismo tipo, este cambio puede corresponder aun SNP no sinónimo. Si el cambio de aminoácido es poruno completamente diferente que se produjo una muta-ción de sentido equivocado no conservativa y es muchomás probable que tenga consecuencias en la función dela proteína. Se produce una mutación sin sentido, cuan-do el cambio origina que un codón codificante se vuelvade paro, lo cual generará una proteína truncada o ladegradación del mRNA. También puede ocurrir lo con-trario, que un codón de alto se vuelva codificante, lo quegenerará que la síntesis continué hasta el siguiente codónde paro, lo que producirá proteínas de mayor tamaño,que por lo general se pliegan mal y se acumulan en lascélulas. La inserción o deleción de nucleótidos en unORF puede llevar a la adición o pérdida de aminoácidosen la proteína si es un número múltiplo de tres (inser-ción o deleción en fase) o a que se produzca un cambioo corrimiento en el marco de lectura generando proteí-nas diferentes y por lo general truncas o ausentes por lageneración de codones de alto prematuros (AnexoMutación y enfermedad).

Los sistemas de reparación son tan complejos como lamaquinaría misma de replicación y tienen una participa-ción importante en la sobrevivencia celular. Los sistemasde reparación son capaces de reconocer diferentes distor-siones en la molécula de DNA como señales para activarsu acción y cada célula cuenta con varios sistemas capa-

ces de lidiar con el daño. En el genoma humano se hanidentificado > 130 genes cuyos productos participan enlos diferentes mecanismos de reparación. Éstos puedendividirse en varios tipos de acuerdo al tipo de daño quereconocen y a la forma en que éste es reparado. Laimportancia de los mecanismos de reparación se observaen los graves padecimientos ocasionados por defectos enellos. En el cuadro 2-6 se muestran los principales siste-mas de reparación del genoma humano, el tipo de dañoque reparan y las proteínas que participan en cada unode ellos, así como los padecimientos que se producencuando se alteran sus funciones.

Los sistemas de reparación pueden actuar de formadirecta, es decir corrigiendo la alteración en las basesnitrogenadas o por escisión del fragmento dañado yresíntesis de DNA, reparación por escisión de base(BER) o reparación por escición de nucleótidos (NER).De manera adicional las roturas de doble cadena (DSB)en la molécula del DNA pueden ser reparadas porrecombinación homóloga (HR) o unión de extremos nohomólogos (NHEJ). Cuando la replicación se realiza condaño en la molécula de DNA o durante la recombina-ción, pueden quedar bases mal apareadas que pueden sercorregidas por la capacidad de edición de las DNA pol opor un mecanismo de escición específico para bases malapareadas (MMR) (figura 2-5). Por otra parte, algunaslesiones como los dímeros de pirimidina cuando no sonreparados antes de la replicación, hacen que las DNA polreplicativas detengan la síntesis dejando huecos en lamolécula que son completados por DNA polimerasas desíntesis sobre lesión (TLS), por lo general propensas aerror (cuadro 2-4).

Reparación directa. Este sistema revierte el daño alDNA, en humanos una enzima específica es capaz de

Secuencia normalA

5´...

3´...

...3´

...5´

ARG TCT CAA AAG TTT ACG CGT

TAC AGA GTT TTC AAA TGC GCA

met ser gln lys phe thr arg

5´...

3´...

...3´

...5´

ARG TCT CAA GAG TTT ACG CGT

TAC AGA GTT CTC AAA TGC GCA

met ser gln glu phe thr arg

Mutación de sentido equivocado no conservativaD

5´...

3´...

...3´

...5´

ATG TCT CAA AAA TTT ACG CGT

TAC AGA GTT TTT AAA TGC GCA

met ser gln lys phe thr arg

Mutación silencioso o sinónimaB

5´...

3´...

...3´

...5´

ATG TCT CAA TAG TTT ACG CGT

TAC AGA GTT ATC AAA TGC GCA

met ser gln alto

Mutación sin sentidoE

5´...

3´...

...3´

...5´

ATG TCT CAA AGG TTT ACG CGT

TAC AGA GTT TCT AAA TGC GCA

met ser gln arg phe thr arg

Mutación de sentido equivocado conservativa o neutral

5´...

3´...

...3´

...5´

ATG TCT CAA CAA ATT TAC GCG

TAC AGA GTT GTT TAA ATG CGC

met ser gln gln ile tyr ala

Mutación por cambio en el marco de lecturaC F

Figura 2-4. Efecto de las mutaciones puntuales, transiciones y transversiones y de la inserción de un par de nucleótidos en un ORF.

Bases moleculares de la herencia 13©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 14: Cap 2_Bases Moleculares de La Herencia_Castillo

Cuadro 2-6. Principales sistemas de reparación del DNA en el humano y sus componentesSistema de reparación

Directo

Escisión de base(BER)

Escisión denucleótidos (NER)

Bases malapareadas (MMR)

Recombinación homóloga (HR)

Unión de extremos no homólogos (NHEJ)

Reparación deenlaces cruzados

Síntesis sobrelesión

Padecimientospor alteración en

reparaciónCáncer

Glucosidasa MYHcáncer colon

Xeroderma pigmentoso,

Síndrome de Cockaine,

Tricotiodistrofia

Carcinoma de colon hereditario no polipósico HNPC o síndrome de Lynch

Ataxia telangiectasiaSíndrome Nijmegen

Cáncer mama, ovario,próstata

Anemia de Fanconi

Cáncer mama

DNA pol (Variante de Xerodermapigmentoso

Funciones

Eliminación del grupo metilo

Rompimiento del enlace N-glucosídico y liberación de basedañadaCorte enlace fosfodiéster,generación de sitios apurínicos yapirimídicosLlenado hueco, maquinaria dereplicaciónForma enlace fosfodiésterReconocimiento daño enreparación global genomaReconocimiento daño en reparaciónglobal,ligasa E3 de ubicuitina

Reparación acoplada atranscripción, ligasa E3 de ubicuitinaReparación acoplada atranscripción, ATPasadependiente de DNAVerificación de daño, localizaciónmaquinaria reparaciónHelicasa TFIID 3’-5’Helicasa TFIID 5’-3’Endonucleasa 5’Endonucleasa 3’Llenado del hueco, maquinaria dereplicaciónForma enlace fosfodiésterReconocimiento bases malapareadas y pequeñasinserciones-delecionesReconocimiento y corte

Llenado del huecoSeñalización de dañoProducción cadena con extremo3’ libreSeñalización Dirige RAD51 a la lesiónHomólogo a RecA, invasiónLlenado de huecosReconocimiento dañoApareamientoSíntesisLigaciónReconocimiento daño, complejo demúltiples subunidades, ligasa E3de ubicuitinaEfectores reparación. Llevar RAD51recombinación homóloga

Señalización HRLlenado de huecos

Incorporación de núcleotidoscometiendo errores, mecanismoaltamente mutagénico

Componentes

Metil-O-6- guanosinametil transferasa8 DNA glucosidadas Cada una identifica untipo de base alteradaAP endonucleasa

DNA pol #

DNA ligasaXPC/HR23

Complejo UVDDBXPE (DDB2)DDB1CSA

CSB

XPA

XPBXPDXPF/ERCC1XPGDNA pol %/&

DNA ligasa IIIMSH2/MSH6

MSH2/MSH3MLH1/ PMS2MLH3Maquinaria replicaciónATMMRE11/RAD50/NBS1

BRCA1BRCA2RAD51Maquinaria replicaciónKU70/KU80Artemisa/DNA-PKDNA pol ?DNA ligasa IVFANC A-M

FANCD2/BRCA2FANCIRAD51BRCA1Maquinaria dereplicaciónDNA polimerasas desíntesis sobre lesión ymaquinaria de replicación

Tipo de daño que repara

Metilación de O6G

Bases alquiladas, oxidadas,incorporación deuracilo

Dímeros de pirimidina, lesionesmonoaductasgrandes

Generadas porerrores dereplicación yrecombinación

Rupturas de doblecadena (DSB)

Rupturas de doblecadena (DSB)

Lesiones diaductascon enlacescruzados

Relleno huecosdejados por DNApol de replicaciónante una lesión

14 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 15: Cap 2_Bases Moleculares de La Herencia_Castillo

alquilar la O6-metil-guanosina de manera directa (cua-dro 2-6). En las bacterias y muchos otros organismos, losdímeros de timina pueden ser removidos en una reacciónde fotorreactivación que depende de la luz de onda visi-ble y de una enzima, la fotoliasa. En mamíferos se hanencontrado enzimas relacionadas con la fotoliasa, aun-que su función es diferente, ya que participan en el con-trol del reloj circadiano.

Reparación por escisión de base (BER). Este es el meca-nismo de reparación predominante contra las lesiones abases producidas por hidrólisis, desaminación, radiacionesionizantes, especies reactivas de oxígeno (ROS), agentesalquilantes y análogos de bases. La eficiencia y especificidadde este mecanismo está determinado por la existencia dediferentes formas de DNA glucosidasas que remueven dife-rentes tipos de bases modificadas por corte del enlace N-glu-cosídico creando un sitio abásico (AP) o una ruptura decadena sencilla (SSB). Los sitios AP son eliminados poracción de la endonucleasa AP (AP1), quien junto con unafosfodiesterasa rompen el DNA 5’ o 3’ del sitio AP respecti-vamente. El hueco generado puede ser de un solo nucleóti-do (SP-BER, short patch) o de dos o más (LP-BER, longpatch). A continuación el hueco es llenado por una DNA polde reparación, la DNA pol #, y por último una DNA ligasaIII o I sella de acuerdo al tamaño, SP o LP respectivamente.

Reparación por escisión de nucleótidos (NER). Estemecanismo es muy importante en la reparación del dañoproducido por la radiación ultravioleta, así como tam-bién en la generación de aductos grandes y enlaces cru-zados entre las bases. La NER puede dividirse en dos cla-ses, la reparación global del genoma (GGR) y la repara-ción acoplada a transcripción (TCR). Ambos sistemasremueven de manera eficiente el daño y utilizan algunoselementos comunes; sin embargo, las moléculas que

detectan el daño son diferentes. La GGR es un procesoal azar que ocurre de forma gradual, mientras que laTCR está intimamente ligada a la RNA pol II y es alta-mente específica y eficiente. Cuando la maquinaria detranscripción de la RNA pol II encuentra una lesión sedetiene y la polimerasa es desplazada lo cual lleva a launión de dos proteínas CSA (Cockayne syndrome A,MIM 216400) y CSB (Cockayne syndrome B, MIM133540) a la lesión, esta última perteneciente a la fami-lia de remodeladores de cromatina SWI/SNF y con acti-vidad de ATPasa estimulada por DNA. Esta actividadparece ser indispensable para el reclutamiento de lamaquinaria de reparación. En la GGR el daño es recono-cido por XPC (xeroderma pigmentosum C) y la proteínaHR23B, con la unión posterior del complejo D formadopor DDB1 y DDB2 (XPE). A continuación ambas víascomparten la maquinaria de reparación, las actividadesde helicasas XPB y XPD que forman parte del TFIIH yla unión de XPA y RPA que reclutan las actividades deendonucleasas, XPG y XPF/ERCC1, lo cual remueve elfragmento dañado, alrededor de 30 nt, el hueco serállenado por las DNA pol %/& acompañadas de PCNA yRFC y sellado por la DNA ligasa III.

Reparación de bases mal apareadas (MMR). Loserrores en la replicación pueden generar apareamientosde bases erróneos y pequeñas asas por inserciones o dele-ciones de nucleótidos. Éstos son reconocidos porHMUTS", un dímero formado por las proteínas MSH2y MSH6, o en ocasiones por hMUTS# formado porMSH2 y MSH3. Las proteinas localizadas en el DNAunen a hMUTL", dímero formado por MLH1 y PMS2con lo que se ensambla el complejo de reparación, queescinde la base mal apareada de la cadena recién sinteti-zada y permite la resíntesis por una DNA pol.

Actividadmetabólica

Radiación ionizante

Radiación u.v.

Ros Agentesquímicos

Errores enreplicación

Mutación

Tolerancia al dañoSíntesis sobre-lesión

Grancantidad de daño

Adoptosis

Falla en reparación

Mutación

DSB Dímerospirimidina

Aductos SSB Sitio AP Desaminación Bases malapareadas

NHEJ HR NE Directa BER

GGR TCR

R MMR

SP-BER LP-BER

Activación puntos de revisión

Trasducción de señales

Arresto ciclo celular

Apoptosis

Agentes que lesionan al DNA

Mecanismos de reparación

Enfermedades hereditarias y cáncer

Variabilidadselección natural evolución

Figura 2-5. Agentes que lesionan al DNA, daño que producen y mecanismos de reparación en las células humanas. Si el daño no es repara-do adecuadamente puede llevar a la muerte celular o a producir mutaciones, las cuales puden resultar en enfernedad o en variabilidad , lo quepermite la selección natural y la evolución.

Bases moleculares de la herencia 15©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 16: Cap 2_Bases Moleculares de La Herencia_Castillo

16 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Reparación por recombinación homóloga (HR). Éstees un mecanismo eficiente para reparar las DSB genera-das por reacciones bioquímicas complejas, radiacionesionizantes o ROS. Muchas proteínas participan en él y esun sistema libre de error que requiere de una región rela-tivamente grande con secuencia homóloga. El primerpaso para reparar las DSB por HR es la resección delextremo 5’ para producir un extremo 3’ libre de cadenasencilla. En humanos esto se realiza por el complejoMRN, formado por MRE11/RAD50/NBS. La proteínacentral para realizar la recombinación es RAD51 (homó-loga a RecA de E. coli), quien forma un nucleofilamentocapaz de invadir a la otra molécula, posterior a esto haysíntesis de DNA y formación de uniones de Holliday quedeben ser resueltas por resolvasas y ligasas.

Unión de extremos no homólogos (NHEJ). Éste es unmecanismo alternativo a la HR para reparar las DSB, el cuales propenso a error, por lo que por lo general sólo se empleacuando no es posible usar HR, ambos mecanismos compar-ten proteínas de señalización y localización como BRCA1 yBRCA2. La mayoría de las DSB no generan extremos liga-bles, por lo que estos tienen que ser generados. El procesose inicia por la unión de proteínas específicas a los extremosrotos, el complejo Ku, un heretodímero formado porKU70/KU80, que tiene propiedades para formar un puen-te proteico. Además se requiere la actividad catalítica de laDNA protein cinasa (DNA PK) para acercar los extremosdel DNA a través de su interacción con las proteínas, a con-tinuación es reclutado otro grupo de proteínas que incluyea la DNA ligasa IV/XRCC4, artemisa, PINK y polimerasasde la familia X como pol , y pol µ. También parecen nece-sitarse las proteínas ATM y el complejo MNR así como elrecambio de la histona H2A por su variante H2AX, todasellas participantes también en el proceso de HR, para que launión de los extremos no homólogos se realice en formaadecuada.

Síntesis sobre lesión (TLS). Éste es un mecanismo detolerancia de daño y altamente mutagénico. La síntesissobre lesión implica el paso sobre la lesión incorporandonucleótidos en la cadena opuesta. Las DNA polimerasasde síntesis sobre lesión son propensas a error y actúancuando las polimerasas replicativas se detienen ante dañogenerado por radiación UV o ionizante y por diferentesagentes químicos. Una excepción tal vez la constituye laDNA pol ( quien inserta adeninas en posiciones opues-tas a dímeros de timidina generados por luz UV Estapolimerasa también puede replicar sobre sitios AP ylesiones generadas por cisplatino. Las DNA pol de sínte-sis sobrelesión pertenecen en especial a la familia Y, aun-que también hay miembros de las familias A y X con estacapacidad. En el cuadro 2-4 se muestran las DNA poli-merasas de síntesis sobre lesión.

Muchas enfermedades humanas que implican unahipersensibilidad a agentes que lesionan al DNA, o conniveles elevados de daño al DNA celular, no son produc-to de defectos en los sistemas de reparación al DNA, sinode la respuesta celular al DNA dañado. Las células nor-males reaccionan ante el daño al DNA por detención delciclo celular, por diferentes procesos en los puntos dechequeo, hasta que el daño es reparado, o llevando a lamuerte celular si es irreparable. Parte de esta maquinariaestá controlada por la proteína ATM (ataxia telangiecta-sia mutated). Esta proteína es sensora del daño al DNA y

tiene actividad de cinasa activando a otras proteínascomo BRCA1 y TP53. Asimismo, las helicasas de la fami-lia RECQ también son importantes en la reparación. Untipo de daño especial, la presencia de enlaces cruzadosrequiere de un grupo de 12 proteínas denominadasFANC A-M, que se encuentran mutadas en la anemia deFanconi (MIM 227650), además para su reparación serequiere la maquinaria de NER y de HR.

EXPRESIÓN GÉNICA Y SU REGULACIÓN

La información contenida en el DNA de las células seexpresa en dos pasos: transcripción y traducción. Cadacélula de un organismo contiene la misma informacióngenética y la forma en que se expresa, determina suscaracterísticas y funciones. La regulación de la expresióngénica ocurre en diferentes niveles, desde la estructurade la cromatina hasta la vida media de los productos fun-cionales. En general se consideran tres niveles principalesde control o regulación de la expresión génica:

• Control del inicio de la transcripción. Está determinadopor las secuencias del promotor localizadas corrientearriba (5’) a una distancia fija del inicio del primer exóndel gen (nt +1). Requiere de modificaciones en la estruc-tura de la cromatina para la entrada de la maquinariatranscripcional a la secuencia promotora y de la unión deproteínas específicas llamadas factores de transcripción(TF) a sus secuencias blanco en el DNA.

• Control postranscripcional. Implica el procesamiento delas moléculas de RNA, su transporte y localización, latraducción del mRNA, estabilidad y degradación de losRNA, procesamiento y localización de proteínas, estabi-lidad y degradación de estas últimas.

• Control epigenético. Se refiere a los cambios heredablesen la expresión génica, que no dependen de alteracionesen la secuencia del genoma y que están determinadospor la estructura de la cromatina. Este tipo de regulaciónpuede actuar sobre un gen en particular o en regionesespecíficas del genoma, incluso en cromosomas comple-tos y ser transitoria o tener una larga duración y transmi-tirse de una generación a otra (anexo Regulación epige-nética y por ncRNA).

Transcripción y su regulaciónEl RNA es sintetizado por las RNA polimerasas (RNApol) utilizando DNA como molde o templado y ribonu-cleótidos trifosfatados como precursores (ATP, CTP,GTP y UTP). El transcrito primario surge como unacadena sencilla en dirección 5’!3’, que se va elongandopor adición de residuos de nucleósido monofosfato alextremo 3’-OH libre, en forma complementaria a lacadena molde de DNA, lo que elimina un grupo pirofos-fato de los ribonucleótidos trifosfatados. El extremo 5’de la molécula recién sintetizada siempre conserva ungrupo trifosfato. Los transcritos recién sintetizados sonprocesados en el núcleo para formar las moléculas deRNA maduras.

Existen tres tipos diferentes de RNA pol en eucarion-tes, con 12 subunidades proteícas en promedio. Para ini-

Page 17: Cap 2_Bases Moleculares de La Herencia_Castillo

ciar la transcripción se unen a sus promotores mediantela formación de un complejo basal con TF específicos. Enel cuadro 2-7 se muestran las características de las tresRNA pol, sus TF basales, así como los tipos de genes quetranscribe cada una. Los promotores de los genes quetranscriben las RNA pol I y II se ubican corriente arribadel inicio del gen, mientras que los que transcribe laRNA pol III pueden estar corriente-arriba o corriente-abajo, dentro del gen mismo. Pero todos ellos a una dis-tancia fija del nt +1. Los promotores contienen diferen-tes tipos de secuencias conservadas evolutivamente queinfluyen en la eficiencia de la transcripción. En los geneshumanos, unas de las más frecuentes son las “cajas” TATA(TATAAA o sus variantes), localizadas a 25 nt corrientearriba (-25) del inicio de la transcripción y las ricas enGC (GGGCGGG), ambas características de los genes demantenimiento celular. Algunos genes transcritos por laRNA pol II, tienen además cajas CAAT localizadas a -80nt, que incrementan la eficiencia del promotor y otroselementos corriente abajo conocidos como DPE (downstream promoter element) en +28 a +32 nt. Los TF queforman los complejos basales de transcripción por logeneral son ubicuos, un ejemplo es la proteína de unióna la caja TATA (TBP) (TATA binding protein) que formaparte del TFIID y se une a la región principal de los pro-motores con dicha caja, para permitir la unión de la RNApol II. El control del inicio de la transcripción incluyemecanismos que regulan la incorporación del primernucleótido por las RNA polimerasas. Por ejemplo, laRNA pol II necesita la fosforilación del extremo carboxi-lo de su subunidad catalítica por el factor TFII H, unavez que se ha unido a su promotor para poder iniciar lasíntesis, en lo que se conoce como limpieza o abandonodel promotor (figura 2-6).

Los niveles de expresión pueden modificarse por laparticipación de TF específicos que regulan en trans(codificados por secuencias de DNA que están en molé-culas diferentes del gen) al interaccionar con elementosreguladores o secuencias específicas en el DNA. Cuandolos TF se unen a elementos potenciadores aumentan elnivel de transcripción y ésta se evita cuando se unen asilenciadores. Existen otro tipo de secuencias de DNAque funcionan como aislantes o límites para impedir quelos genes adyacentes sean transcritos o por el contrariosilenciados. Potenciadores, silenciadores, elementos derespuesta y aislantes regulan en cis la expresión génica(es decir sobre la misma molécula de DNA donde seencuentran) y pueden localizarse incluso a miles depares de nucleótidos de los promotores basales, tantocorriente arriba (5’), como corriente abajo (3’) o enintrones. Las secuencias de nucleótidos de los elementosreguladores están conservadas evolutivamente, repetidasa lo largo del genoma y son reconocidas por TF condominios específicos (figura 2-6).

Los TF tienen dominios conservados para unirse alDNA y dominios de activación. Estos últimos sondiversos y se activan por diferentes mecanismos queincluyen adición y eliminación de grupos que modifi-can su estructura como fosforilación, metilación, aceti-lación, entre otros, interacción con otros factores for-mando homodímeros, heterodímeros o tetrámeros,unión a ligandos, localización celular, entre otros. Laación de los TF modifica la expresión génica en losdiferentes tejidos y en las diferentes etapas de la vida(cuadro 2-8).

En los diferentes tejidos la regulación de la trans-cripción de un gen incluye mecanismos de control porproteínas y ncRNA que seleccionan transcritos alter-nativos de un mismo gen. El uso de promotores dife-rentes puede resultar en isoformas con distintas pro-piedades. Con frecuencia se generan transcritos con unprimer exón diferente que pueden traducirse en unmismo péptido si se unen a los mismos exones subse-cuentes; sin embargo, los mRNA tendrán estabilidad,unión a ribosomas y vidas medias diferentes. Por otraparte, se pueden generar proteínas diferentes si cambiael marco de lectura. En otros casos, la presencia de pro-motores internos originará productos proteicos máspequeños con el mismo o difente ORF.

Durante la elongación y terminación de la transcrip-ción existen también mecanismos de control, en especialpor interacción de proteínas específicas y ncRNA conestructuras secundarias en el transcrito, en el DNAmolde o ambos. En el control de la elongación participancomplejos remodeladores de cromatina que facilitan eldesplazamiento de las RNApol por los nucleosomas yproteínas chaperonas de histonas como SSRP1 (structu-re specific recognition protein), también llamada FACT,Ésta interactúa especificamente con las histonesH2A/H2B para permitir el desensamblado de los nucle-osomas y la elongación de los transcritos.

Procesamiento del RNA y su regulaciónLas modificaciones postranscripcionales a los transcritosprimarios de la RNA pol II, incluyen modificaciones ensus extremos, la remoción de los intrones y empalme deexones, edición, transporte y degradación. En cuantosurge el transcrito primario, se adiciona al extremo 5’ unnucleótido, 7-metil-guanosina trifosfato (7’mG), llama-do Cap o caperuza que le sirve de protección contra ladegradación por exonucleasas 5’! 3’, facilita la subse-cuente eliminación de intrones y el transporte del núcleoal citoplasma (figura 2-7).

Cuadro 2-7. RNA polimerasas de eucariontes, genes que transcriben, características y sus factores basalesde transcripción

ClaseRNA Pol IRNA Pol II

RNA Pol III

Factores basales TIF-IATIF-IB (TBP)UBF TFII A-HTFIID (TBP)TFIII A-CTFIII B (TBP)

CaracterísticasUn sólo transcrito 45S en nucleoloTranscripción de todos los genes quecodifican proteínas, sus transcritoscontienen Cap y cola poli(A)Algunos promotores son internos y otrosse localizan corriente arriba. Transcribe unnúmero importante de retrotransposones

Genes que transcriberRNA 28S, rRNA 18S, rRNA 5.8SmRNA, snRNA, miRNA, RNA antisentido

5SrRNA, tRNA, U6snRNA, 7SLRNA,7SKRNA, 7SM RNA, siRNA,retrotransposones Alu

Bases moleculares de la herencia 17©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 18: Cap 2_Bases Moleculares de La Herencia_Castillo

DPE

Potenciador

RF

Elementosproximales promotor

Núcleopromotor

Adistal

Pote

ncia

dor 5

´

Silenciador RF RF+1

TATA Potenciador 3´INR

Aislante

Elementos reguladores 5’ Núcleo del promotor

Unión de TBP a núcleo promotor

Reclutamiento o TF basales RNA pol II

Complejo basal transcripción inactivo

Activación RNApol II, liberaciónpromotor e inicio transcripción

TATA +1 DPE

TATA

P P

PP

PP

Cap

TBP TAFs

TFIID

TFIID TAFs

TATA

TFIIB

TFIIF TFIIHTFIIE

RNA pol II

TFIID

TFIIHTFIIETFIIB

TFIIF RNA pol II

TATA

RNA pol II

TATATFIIE

TFIIH

TFIIF

TFIIB

RNA pol II

Figura 2-6. A. Elementos reguladores de la transcripción en eucariontes. Contiene distintos elementos potenciadores intercalados consilenciadores y elementos aislantes, localizados a 25 kb en promedio, corriente arriba o abajo del núcleo del promotor que incluye la caja TATA,secuencias de inicio de la transcripción (INR) y elementos corriente abajo del promotor (DPE). B.Inicio de la transcripción de genes porRNA polimerasa II. Se inicia por la unión de sus factores basales a la región promotora: TFII A-H, la proteína TBP que forma parte de TFIID,y por último la RNA pol II, la cual es activada por fosforilación de su extremo carboxilo por TFIIH, lo que hace que se libere del promotor e ini-cie la transcripción.

18 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 19: Cap 2_Bases Moleculares de La Herencia_Castillo

Como parte del mecanismo de terminación de latranscripción, en el extremo 3’ del transcrito primario lasecuencia AAUAAA es reconocida por un complejo pro-teico que corta 15-20 nt corriente abajo para liberarlodel heterodúplex DNA-RNA. Inmediatamente despuéses poliadenilado (unión de 200 adeninas aproximada-mente) por la proteína unidora de poliadenilato (polyAbinding protein). Esta modificación es necesaria para per-mitir el transporte del mRNA al citoplasma, evitar sudegradación y aumentar el reconocimiento por los ribo-somas para su traducción. Una excepción a esta modifi-cación la constituyen los genes de histonas cuyos mRNAno son poliadenilados y la terminación implica un corteen el extremo 3’ del transcrito primario dependiente deuna estructura secundaria formada al interactuar con elextremo 5’ del snRNA U7.

El mecanismo de eliminacion de intrones y unión deexones es dependiente de secuencias conservadas en loslímites exón-intrón. Por lo general el intrón inicia con eldinucléotido GT (GU a nivel de RNA) y termina conAG. Además se requiere de una tercera secuencia intró-nica, el sitio ramificador, localizada a aproximadamente40 nt del extremo 3’ del intrón (figura 2-7).

El mecanismo de eliminación de intrones y reuniónde exones sigue la siguiente secuencia:a) Rotura en el extremo 5’ del intrón, ataque nucleofílico

por el nucleótido G terminal del sitio donador a la ade-

nina (A) del sitio ramificador para formar una estructu-ra en asa.

b) Corte en el extremo 3’ de la unión intrón-exón, liberan-do el RNA intrónico como un asa.

c) Reunión de los exones (figura 2-8).

Estas reacciones son mediadas por el complejo removedorde intrones y empalmador de exones, de naturaleza ribonu-cleoproteíca, compuesto de cinco tipos de snRNA y más de100 proteínas. Los snRNA participantes en la mayoría delos intrones de genes que codifican para polipéptidos son:U1, U2, U4, U5 y U6. Este proceso está mediado por lacomplementaridad de bases tanto entre las secuencias con-servadas en la unión exón-intrón y los snRNA, como entreellos. Un segundo tipo de complejo participa para eliminaruna clase de intrones poco frecuentes donde los dinucleóti-dos conservados GT y AG son reemplazados por las secuen-cias AT y AC respectivamente. En este caso los snRNA U11y U12 reemplazan las funciones de los snRNA U1 y U2(figura 2-8 y cuadro 2-9).

A partir de alrededor de 21 000 genes en el humanose generan más de 200 000 proteínas diferentes. Lamayoría de nuestros genes presenta uso alternativo deexones que produce diferentes RNA maduros y un grannúmero de proteínas con propiedades y funciones dife-rentes, de acuerdo al tejido y etapa del desarrollo; esteproceso está regulado por ncRNA y proteínas.

Cuadro 2-8. Factores de transcripción, dominios de unión a DNA, mecanismos de activación y funcionesFactor transcripción

Superfamilia de receptoresnucleares. Receptores ahormonas esteroides SP1

Proteínas genes HOX, conhomeodominiosOCT-1, OCT-2, PIT-1

NF-KB

MYODFOS/JUN

CRE/ATF1 (Elemento derespuesta a cAMP)

FuncionesMorfogénesis, expresión einhibición múltiples genes entejidos blancoActivación de genes deldesarrollo tempranoEncendido y apagado de genesdurante desarrollo embrionarioActivación de genes durante eldesarrollo embrionarioRespuesta inmune, control deapoptosis

Diferenciación tejido muscularUnión a sitios AP1, regulaciónciclo celular, punto de restricciónActiva genes de sistemanervioso y esqueleto

Mecanismo activaciónUnión a ligando y dimerización

Unión a caja GC (GGGCGG)ubicuoSíntesis

Unión a ligando y dimerización

Transducción de señales,fosforilación del inhibidor IKBy su degradación, dimerizaciónCambio de pareja, heterodímerosTransducción de señales yheterodimerizaciónTransducción de señales

Dominio unión a DNADedos de zinc (ZF)

Dedos de Zinc

Hélice-vuelta hélice, (HTH)

Un homeodominio y undominio POUDominio homólogo a REL, RHD,estructuras ß plegadas ydominios inmunoglobulinasHélice-asa-hélice, HLHCierre de leucina, LZ

Cierre de leucina

nt + 1 iniciotranscripción

Sitiodonador

Sitio de ramificación cura Sitio

aceptorAU ORF

Exones codificantes e intronesUGA

Señal depoliadenilación

AAUAAA

Último exón

UTR 3´UTR 5´

Exón 1 Exón 2

30 a 50 pb

AC

AG GU AGUA YYYYYYYYYG G AG

Figura 2-7. Estructura del transcrito primario de un gen codificante. Se muestran las secuencias necesarias para la remoción de los intronesy empalme de exones, conservadas evolutivamente, y la señal de poliadenilación en el último exón.

Bases moleculares de la herencia 19©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 20: Cap 2_Bases Moleculares de La Herencia_Castillo

Los ncRNA recién sintetizados también son procesa-dos de manera postranscripcional. Por ejemplo, los rRNAson transcritos en el nucleolo por la RNA pol I como unamolécula 45S que es procesada para generar los rRNA18S, 5.8S y 28S. El procesamiento lo inicia el snRNA U3con una serie de acciones de endo y exonucleasas paragenerar las moléculas individuales. En el nucleolo, nume-rosos ncRNA que forman dos grupos de snoRNA sonresponsables de aparear con los rRNA en los sitios enque serán modificados. El grupo C/D identifica sitiosblanco para metilación y el grupo H/ACA especificasitios donde la uridina es convertida a seudouridina, estasmodificaciones son necesarias para que los rRNA inte-ractuen con las proteínas ribosomales y formen riboso-mas funcionales. Asi mismo los tRNA requieren de unprocesamiento que implica la acción de reacciones sepa-radas de endonucleasa y ligasa. La endonucleasa recono-ce la estructura secundaria/terciaria del precursor y cortaa ambos lados del intrón. Las dos mitades del tRNA

generadas al eliminar el intrón pueden ser unidas por laligasa de tRNA en presencia de ATP. La maduración delos tRNA es regulada por la vía de respuesta a las prote-ínas no plegadas generada en el retículo endoplásmico.

Edición del mRNA. Es una forma de procesamientopostranscripcional que consiste en la inserción, elimina-ción o cambio de nucleótidos mediante enzimas. Lasinserciones o eliminaciones en el RNA parecen serexclusivas de las mitocondrias de protozoarios como lostripanosomas. En mamíferos no se han encontrado evi-dencias de inserciones o eliminaciones, aunque sí se hanobservado algunas sustituciones en un número limitadode genes. Éstas se producen por desaminasas dependien-tes de RNA que actúan sobre residuos de C y A. Porejemplo, la edición C-U ocurre en el mRNA humano delgen APOB (apolipoproteína B). En el hígado se produceuna proteína de 4536 aminoácidos, APOB100, mientrasque en el intestino, la desaminasa de citosina APO-BEC1, convierte la citosina 6666 en uridina, generandoun codón de paro y una proteína de 2152 aminoácidos,APOB48, que es indispensable para convertir en quilo-micrones los lípidos de la dieta.

Transporte y degradación del mRNA. La estructurade un mRNA es modificada por elementos actuando encis y proteínas de unión a RNA actuando en trans parapermitir su interacción con otras proteínas, poniendo encontacto secuencias remotas. Esto genera señales de loca-lización o tráfico para transportar a los mRNA como par-tículas ribonucleoproteicas (RNP) a lugares celularesespecíficos. Por ejemplo, la proteína FMRP participa enla localización de algunos mensajeros en los axones, endonde son traducidos. Este mecanismo permite que lasproteínas lleguen en menos tiempo, que el generado porsu transporte, al sitio en que ejercerán su función en unacélula. La mayor parte de los elementos que regulan estemecanismo se localizan en los UTR 3’ de los mRNA.

Núcleo5´ 3´

3´Transcripción

Transcrito primario5´m7Gppp

Poliadenilación

5´m7Gppp

RNAsn

AAAA 3´

Asa del intrón

5´m7Gppp

5´m7GpppExón 1 Exón 2

AAAA 3´

AAAA 3´

Complejo removedor de intronesy empalmador de exones

RNA maduro

Citoplasma

GU

A G

Figura 2-8. Procesamiento post-transcripcional del transcrito primario de la RNA pol IIen una célula eucarionte. Adición de CAP (m7G) en elextremo 5´, poliadenilación en el extremo 3´, remoción de intrones y empalme de exones para generar el mRNA

Cuadro 2-9. Funciones de los snRNA en la remoción de intrones

ComplejoSnRNPU1

U2U4, U5, U6U5U5, U6U11

U12

Función

Unión al sitio donador, extremo 5’ del intrónGU-AG (>98%)Unión al sitio de ramificación del intrón GU a AGInteracción entre los dos sitios de corteInteracción entre los dos exonesCentro catalíticoUnión al sitio donador en intrones AU a AC(<2%)Unión al sitio de ramificación en intrones AUa AC

SnRNP complejo de ribonucleoprotína parte del complejo removedor de intro-nes y empalmador de exones.

20 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 21: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia 21©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Las modificaciones en ambos extremos del mRNA loprotejen de degradación por exonucleasas. La mayoría delos mRNA eucariontes son degradados por cualquiera dedos vías dependientes de deadenilación catalizada por poli(A) nucleasas En una de estas vías, cuando la cola de poli(A) alcanza un tamaño crítico (aprox 10 nucleótidos) queya no es capaz de mantener la interacción con la proteína deunión a poli (A), se desestabiliza el complejo de unión alCap que incluye a los factores de traducción eIF4G, eIF4E,y eIF4A, lo que conduce a rearreglos posteriores para expo-ner el extremo 5‘P Cap a la enzima decapitadora y a conti-nuación a la digestión por exonucleasas en dirección 5’-3’.La enzima decapitadora compite por el Cap con el comple-jo de factores de inicio de la traducción de unión al Cap. Enla otra vía, el exosoma, un complejo evolutivamente conser-vado, cataliza la digestión en dirección 3’-5’. La degradaciónde los mRNA por lo general ocurre dentro de partículascitoplásmicas discretas, llamadas cuerpos de procesamiento(PB, processing bodies). De manera adicional existe una granvariedad de partículas citoplásmicas que contienen mRNAreprimidos para que no se traduzcan. Este mecanismo derepresión y también otro mecanismo de degradación demRNA específicos es regulado por miRNA (AnexoRegulación epigenética y por ncRNA). En general la vidamedia de un mRNA eucarionte depende de secuencias yestructuras específicas en él y de la presencia de factoresestabilizantes y desestabilizantes.

Diversas vías de regulación son necesarias para mantenerla fidelidad y precisión de la expresión individual de losgenes. Uno de estos mecanismos de supervivencia detecta alos mensajeros con defectos en el procesamiento en elnúcleo y a aquéllos que contienen mutaciones que determi-nan codones de paro prematuro o su ausencia. Los transcri-tos con codones de alto prematuros son decapitados en elcitoplasma, antes de que se dé el acortamiento de la cola depoli (A). En células de mamíferos, el mecanismo de detec-ción de codones de paro prematuros parece depender de loscomplejos de ribonucleoproteína que se ensamblan en lasuniones de los exones del mRNA. Los complejos EJC (exonjunction complex) participan en la regulación del transportenúcleo-citoplasma y evitan que los transcritos primarios enlos que no se han eliminado los intrones lleguen al citoplas-ma. Una de las señales para la degradación de estos mensa-jeros es la presencia de los EJC después de un codón de alto.A este mecanismo se le conoce como decaimiento demRNA por codones de paro prematuros (NMD). Este es elmecanismo de supervivencia mejor estudiado en humanos,se calcula que aproximadamente 60 a 70% de los premRNA tienen uso alternativo de exones y que 45% de éstostienen al menos una forma que debe degradarse por NMD.La presencia de codones de alto prematuro también es con-secuencia de mutaciones patogénicas en exones e intronesde muchos genes. La presencia de proteínas truncadas conefectos dominantes negativos puede tener consecuenciasmás graves para una célula que la falta de un producto, porlo que estos mRNA también son regulados de forma pos-transcripcional por NMD.

Síntesis de proteínas y su regulaciónLa traducción del mRNA se lleva a cabo en los riboso-mas con la participación de los aminoacil-tRNA, energíay factores proteicos específicos. Los tRNA son moléculas

de 74 a 95 nucleótidos donde algunos de ellos son modi-ficados de forma postranscripcional para convertirlos en:seudouridina, inosina, dihidrouridina, 1-metilguanosinay ribotimidina. Estas modificaciones participan en elreconocimiento por las aminoacil-tRNA sintetasas, enzi-mas que unen el aminoácido a su correspondiente tRNAformando, mediante hidrolisis de ATP, los aminoacil-tRNA.

Los mRNA maduros en el citoplasma se acoplan a losribosomas en presencia de factores de traducción. Lainformación del mRNA se lee en dirección 5’®3’ y elpolipéptido crece del extremo amino al carboxilo, deacuerdo al código genético. Éste relaciona la combi-nación de tres nucleótidos o codón, con los aminoácidostransportados por los tRNA que poseen una región com-plementaria o anticodón que se adapta al codón demanera específica. El código genético es el mismo paratodos los organismos (universal) con algunas excepcio-nes, en especial en los genomas mitocondriales. De los 64tripletes, 61 especifican los 20 aminoácidos, por lo por loque cada aminoácido tiene más de un codón, lo que seconoce como redundancia o degeneración del código,excepto triptófano y metionina que tienen un solocodón; los tres codones restantes son señales de paro oalto de la traducción. En la lectura del código no existepuntuación entre los codones, simplemente se van leyen-do de tres en tres durante la traducción y es importanteseñalar que cada codón es específico para un aminoácidoparticular (figura 2-9).

Los ribosomas eucariontes están formados por dossubunidades compuestas por RNA y proteínas: unapequeña (40S) constituida por el rRNA 18S y más de 30proteínas y otra mayor (60S) que incluye los rRNA 28S,5.8S y 5S, y más de 50 proteínas. Cada ribosoma tienetres sitios activos, el sitio A aceptor o aminoacil, dondese une el aminoacil - tRNA entrante; el sitio P portadorde la cadena polipeptídica o peptidil y el sitio E de sali-da (exit) a donde se desplaza el tRNA descargado parasalir del ribosoma. Un mensajero puede ser leído porvarios ribosomas activos (polisoma o polirribosoma) for-mando cada uno, una cadena polipeptídica (figura 2-10).

La síntesis de proteínas se divide en tres etapas: inicio,elongación y terminación. El inicio requiere del comple-jo que se forma por la unión del tRNAi

met al extremo 5’del mRNA, en presencia del factor eIF4, un multímeroproteico que incluye al complejo de unión al Cap (CBP,cap binding protein) y del factor de inicio eIF-3 para unir-se a la subunidad 40S del ribosoma con ayuda del factorde inicio eIF-2 y GTP, que forman un complejo ternariocon el tRNAi

met . Este tRNA es diferente del tRNAmet

que reconoce los codones AUG internos y es el únicoque se entra de manera directa al sitio P del ribosoma.Además, la cola de poli A y la distancia al extremo 3 delmRNA también influyen en la unión del complejo depre-iniciación al mRNA. Esta interacción está mediadapor la proteína de unión a la cola de poli A o PADP (pol-yadenylate-binding protein), que se asocia con el comple-jo eIF-4 y ocasiona el plegamiento sobre sí mismo delmRNA. Así, el tamaño de la cola de poli A interviene enla regulación del inicio de traducción de un mRNA par-ticular. A continuación el complejo avanza sobre elmRNA hasta encontrar el codón de inicio, casi siempreAUG, que está contenido en la secuencia consenso 5 -

Page 22: Cap 2_Bases Moleculares de La Herencia_Castillo

UCAG

Segundo nucleótido

Prim

er n

ucle

ótid

oTercer nucleótido

U C A C

C

U

A

G

UCAG

UCAG

UCAG

UUUUUCUUAUUC

phepheleuleu

FFLL

UCUUCCUCAUCG

serserserser

SSSS

UAUUACUAAUAG

tyr tyrparoparo

YY

UGUUGCUGAUGG

cys cysparo trp

CC

W

CUUCUCCUACUG

leuleuleuleu

LLLL

CCUCCCCCACCG

propropropro

PPPP

CAUCACCAACAG

hishisglngln

HHQQ

CGUCGCCGACGG

argargargarg

RRRR

AUUAUAAUCAUG

ileileilemet

IIIM

ACUACCACAACG

thrthrthrthr

TTTT

AAUAACAAAAAG

asnasnlyslys

NNNN

AGUAGCAGAAGG

serserargarg

SSRR

GUUGUAGUCGUG

valvalvalval

VVVV

GCUGCCGCAGCG

alaalaalaala

AAAA

GAUGACGAAGAG

aspaspgluglu

DDEE

GGUGGCGGAGGG

glyglyglygly

GGGG

Figura 2-9. Código genético. La secuencia nucleotídica de cada triplete o codón de mRNA especifica la incorporación del aminoácido indica-do (en nomenclatura de tres y una letra) o la terminación de la cadena polipeptídica (paro).

G

Extremo amino

Cadena polipeptídica

Aminoácidos libres

Glutamil-tRNA

tRNA

Anticodón

tRNA

mRNARibosoma

Dirección del ribosoma

MCWI

Q H G C B NA

F

G

UCCACC

W

G

CCA

AGG AUG GGU UGG5-´ -3´

Codón

G

CG

CCA

AGG AUGU GGU U

EA

P

UAC

M

R

G

NH2

Q

CUU

GC M

QE

Figura 2-10. Esquema general de traducción y síntesis de proteínas.

22 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

Page 23: Cap 2_Bases Moleculares de La Herencia_Castillo

GCCPuCCAUGG-3 denominada secuencia Kozak.Tanto la unión del complejo de pre-iniciación al mRNA,como su migración hasta el codón de inicio son procesosdependientes de energía que requieren la hidrólisis deATP. A continuación se une la subunidad ribosómica 60Spor hidrólisis de GTP mediada por el factor eIF-5 quelibera a otros factores como el eIF-6 que se encontrabaasociado con la subunidad ribosómica grande libre, pre-viniendo la unión de las subunidades 40S en el citoplas-ma. Esto último resulta en la formación del complejo deinicio 80S, donde el tRNAi

met ocupa el sitio P del riboso-ma. Subsecuentemente, el sitio A es ocupado por el ami-noacil-tRNA especificado por el segundo codón delmRNA, comenzando la etapa de elongación. La entradade los diferentes aminoacil-tRNA al sitio A es mediadapor el factor de elongación eEF-1, un complejo de 4subunidades con actividad de proteína G, e implica lahidrólisis de GTP. La formación del enlace peptídicoentre la metionina del RNAti

met en el sitio P y el amino-ácido del segundo tRNA en el sitio A, es catalizada porla actividad de peptidiltransferasa de la subunidad ribo-sómica grande, cuya actividad incluye la deacilación deltRNA. Esta acción requiere de la hidrólisis de GTPunido al factor eEF-1. Una vez que se forma el dipépti-do correspondiente a los dos primeros codones del ORF,el siguiente paso es la translocación, que ocurre en tresetapas: 1) el ribosoma se mueve en dirección 5 !3 , a lolargo de tres nucleótidos de manera que el siguientecodón ocupa el sitio A, 2) el tRNA-dipéptido en el sitioA se desplaza al sitio P y 3) el tRNA deacilado en el sitioP se mueve a la tercera posición o sitio E, siendo a con-tinuación expulsado del ribosoma. La translocaciónrequiere de hidrólisis de GTP, mediada por el factor eEF-2, dejando el sitio A libre para permitir la entrada delsiguiente aminoacil-tRNA. El ciclo de elongación serepite continuamente hasta llegar al codón de termina-ción donde se une alguno de los factores de liberación,eRF, que reconoce cualquiera de los tres codones de ter-minación. La hidrólisis de GTP es necesaria para la libe-ración del polipéptido recién sintetizado, del tRNA y

para la disociación del complejo de traducción. Las subu-nidades ribosómicas regresan a la poza citoplasmáticapara ser utilizadas nuevamente, mientras que los mRNAse degradan una vez traducidos. En la figura 2-10 semuestra un esquema general de la síntesis proteica y enel cuadro 2-10 un resumen de los factores proteicos queintervienen en ella.

Los mecanismos de control de la traducción son, des-pués del control transcripcional y la estabilidad delmRNA, los principales determinantes de los niveles fina-les de proteína. Tanto el UTR 5’ como el UTR 3’ delmRNA pueden tener elementos que modulen la eficien-cia de la traducción Un punto importante de la regula-ción del inicio de la traducción se establece entre lassecuencias en el UTR 3’ y su interacción con la proteínade unión a la cola de poli A y el factor de inicio de la tra-ducción eIF4F, llevando a circularizar al mRNA y facili-tar el inicio de la traducción o por el contrario, por launión proteínas que impiden esta interacción. El controlde la traducción dependiente del Cap ocurre en especialdurante su inicio, implicando a los eIF y proteínas acce-sorias. El inicio es afectado por diversos estímulos quemodifican el estado de fosforilación de los factores eIF4Ey eIF2 y a través de la unión de las proteínas de unión aeIF4E, lo cual por último inhibe el inicio de la traduccióndependiente del Cap. Bajo condiciones donde la traduc-ción dependiente del Cap es abolida, la traducción detranscritos con sitios de unión internos para ribosomas(IRS) puede realizarse en forma independiente del Cap.Por ejemplo durante el ciclo celular, en la transición G1-S, la traducción se realiza predominantemente en formadependiente del Cap, mientras que durante el paso deG2 a M, la traducción dependiente del Cap es inhibida ylos transcritos se traducen preferentemente en formaindependiente. Otro ejemplo interesante de control de latraducción se realiza en los ovocitos, donde los mRNApresentan colas de poli (A) cortas y una vez ocurrida lafertilización, éstas son alargadas en el citoplasma paraactivar su traducción. Otros mecanismos de regulaciónde la traducción incluyen la interacción de proteínas con

Cuadro 2-10. Factores proteícos que participan en la síntesis de proteínas

ProcardiontesIF-1

IF-2

IF-3

EF-Tu, EF-GEF-TsEF-G

RF1RF2RF3

Función generalBloquea sitio AeIF1 asiste a eIF2 en promover unión de tRNAiMet a subunidad 40S, promueve su disociación

Entrada del tRNA iniciadoreIF2 es una GTPasaeIF3 estimula formación complejo ternario, su unión a 40S y el escaneo del mRNAeIF5B implicado en la entrada del tRNA iniciador, es una GTPasa

Unión de subunidad pequeña al mRNAComplejo eIF4 funciona en la unión al Cap

Unión a GTPIntercambio-GDPTranslocación del ribosoma

Reconocimiento UAA/UAGReconocimiento UAA/UGAEstimulación de otros RF

EucarionteseIF1A

eIF2eIF3eIF5B

eIF1complejo eIF4eIF3

eEF1"eEF1#, eEF1$eEF2

eRF1eRF2eRF3

Factores de inicio

Factores de elongación

Factores de liberación

Bases moleculares de la herencia 23©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Page 24: Cap 2_Bases Moleculares de La Herencia_Castillo

24 Genetica clínica

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

estructuras clave del mRNA y la formación de RNA dedoble cadena por la complementaridad de bases demoléculas antisentido y por último los mecanismos porRNA interferente, mediada en especial por miRNA, quereprimen la traducción, llevan a la degradación del men-sajero o ambos (Anexo Regulación epigenética y porncRNA).

Modificaciones postraduccionales, localización y degradación de proteínasEl polipéptido que emerge del ribosoma por lo generalno es activo por lo que sufre modificaciones postraduc-cionales que incluyen su plegamiento, ruptura proteolíti-ca, modificaciones químicas tales como unión a carbohi-dratos, a lípidos, a grupos fosfato, hidroxilo, acetilo, entreotras, o eliminación de aminoácidos e interacción conotras moléculas para formar la proteína activa.

La función de una proteína depende de su estructurafinal, la cual está determinada por cuatro niveles: La pri-maria o secuencia lineal de aminoácidos; la secundaria oconformación que adopta el polipéptido por la interac-ción entre sus aminoácidos, por lo general como "-héliceo #-plegada, estabilizada por puentes de hidrógeno entrelos grupos carboxilo y amino de sus aminoácidos. La ter-ciaria que resulta del plegamiento de diferentessecciones de "-hélice, #-plegada y otras estructurassecundarias menores, estabilizado por puentes de hidró-geno, fuerzas hidrofóbicas que determinan que aminoá-cidos con grupos no polares queden en la región internade la proteína, o enlaces covalentes como puentes disul-furo entre residuos de cisteína. Por último la estructuracuaternaria donde se asocian dos o más polipéptidos,cada uno plegado en su estructura terciaria, en una pro-teína multimérica. Cada proteína adquiere su propiaestructura por lo general terciaria o cuaternaria, depen-diendo de su función, para el plegamiento participanproteínas chaperonas, como por ejemplo las proteínas dechoque térmico (Hsp70) que promueven el plegamien-to cotraduccional.

Las proteasas eliminan segmentos de uno o ambosextremos del polipéptido, mediante la actividad deamino o carboxipeptidasas, resultando en una forma máscorta de la proteína. Si las ruptura proteolíticas ocurreninternamente se generan diferentes segmentos proteicosa partir del polipéptido recién sintetizado, y cada uno deellos puede constituir una proteína activa. Por otra parte,es frecuente la eliminación de la metionina inicial delproducto primario de traducción, por ejemplo durante lasíntesis de la #-globina. Algunas proteínas son sintetiza-das desde el inicio como poliproteínas con copias múlti-ples unidas extremo a extremo; por ejemplo la ubicuiti-na, es sintetizada como poliproteína. Las proteínas desecreción y las de exportación requieren de una señal delocalización intracelular específica, la cual es una secuen-cia peptídica corta o secuencia señal o líder, que es eli-minada por una peptidasa una vez alcanzado su objetivo.Por ejemplo, las hormonas sintetizadas en un tejido(hipófisis) son cortadas para generar moléculas indivi-duales que son exportadas y actúan en otros, o las prote-ínas enviadas a compartimentos intracelulares como elnúcleo (histonas, polimerasas, factores de transcripción,entre otras), la mitocondria (proteínas ribosomales, com-

ponentes de la cadena respiratoria, entre otras), los pero-xisomas, lisosomas, entre otras. En el caso de las proteí-nas de secreción, el péptido señal contiene 20 aminoáci-dos en especial hidrofóbicos en el extremo amino. Lasecuencia señal se transporta al retículo endoplásmicopor una partícula de reconocimiento de la señal SRP(signal recognition particle), un complejo que contienencRNA (citoplásmicos pequeños), RNA 7SL y seis pro-teínas específicas. El complejo SRP se une tanto al extre-mo creciente de la proteína como al ribosoma y los diri-ge a una proteína receptora de SRP en la superficie dellado citosólico de la membrana del retículo endoplásmi-co rugoso. De allí, el polipéptido puede pasar al lumendel retículo si su destino es exportarse de la célula, o esdetenido si tiene segmentos hidrofóbicos adicionales,como en el caso de las proteínas transmembranales. Lasproteínas mitocondriales, codificadas en núcleo, requie-ren de un péptido señal mitocondrial con aminoácidoshidrofóbicos y con carga positiva, que forman una "-hélice anfipática. Las señales de localización nuclearpueden estar localizadas casi en cualquier sitio de lasecuencia polipeptídica y consisten en segmentos de 4 a8 aminoácidos con carga positiva, junto con residuos deprolina; la señal es bipartita y los aminoácidos positivosse encuentran en dos bloques de 2 a 4 residuos, separa-dos por alrededor de 10 aminoácidos. Algunas proteínasnucleares carecen de señales de localización propias,pero son transportadas al núcleo con la asistencia deotras proteínas nucleares. Así mismo, para salir delnúcleo las proteínas requieren de una señal de exporta-ción nuclear propia o la adquieren por unión a otra pro-teína que la posea. En cuanto a las proteínas lisosomales,la secuencia señal es un residuo de manosa 6-fosfato quese adiciona en el lado cis del aparato de Golgi y es reco-nocida por una proteína en el lado trans del Golgi. Unejemplo de modificaciones postraduccionales que regu-lan la actividad de una proteína es el procesamiento dela insulina en la que se eliminan los primeros 24 amino-ácidos de la preinsulina-proinsulina para dar proinsulina,seguida por dos cortes adicionales que eliminan un seg-mento central dando las dos partes activas de la proteí-na, las cadenas A y B, que son unidas por dos puentesdisulfuro para formar la insulina madura.

Una vez que las proteínas han cumplido su función,son degradadas o modificadas para tener nuevas funcio-nes en respuesta a los requerimientos de la célula. Elconcepto de recambio proteico en una célula no sólorequiere de la síntesis de proteínas de novo, si no de eli-minación de proteínas cuya función ya no se requiera, demanera selectiva y rápida para contender con los cam-bios abruptos que ocurren bajo ciertas condiciones, porejemplo en las transiciones claves del ciclo celular. Asícada proteína tiene una vida media particular. En euca-riontes se ha observado que los aminoácidos del extre-mo-N tienen un papel crítico en la estabilidad inherentede la proteína, por ejemplo, la presencia de ocho amino-ácidos (Ala, Cys, Gly, Met, Pro, Ser, Thr, Val) se correla-ciona con estabilidad (t 1/2 > 20 h), otros ocho (Arg, His,Ile, Leu, Lys, Phe, Trp, Tyr) con una vida media corta (t1/2 2 a 3 min) y la de cuatro (Asn, Asp, Gln, Glu) con unadesestabilización posterior a la modificación química.Una proteína dañada, modificada o con residuo N-termi-nal desestabilizante es ubicuitinada por una enzima con-

Page 25: Cap 2_Bases Moleculares de La Herencia_Castillo

Bases moleculares de la herencia 25©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

jugante de ubicuitina, UBCE (Ubiquitin-ConjugatingEnzyme). La unión covalente de la ubicuitina, se realizaentre la glicina en el C-terminal de ésta y en los residuosde lisina de la proteína a degradar; de manera subsecuen-te son adicionados más residuos formando una cadena depoliubicuitina. La proteína poliubicuitinada es reconoci-da por un complejo múltiple de proteasas, el proteasoma26S. La proteína es digerida en una reacción que requie-re ATP y libera péptidos cortos de 4 a 10 aminoácidos yubicuitinas intactas para su reutilización. Los proteaso-mas se localizan tanto en el citoplasma como en elnúcleo de todas las células, pero no en el lumen de losorganelos celulares de secreción. Las células cuentanademás con otro mecanismo de degradación de proteí-nas, que actúa sobre todo en proteínas de membrana,receptores y sus ligandos, la endocitosis y unión a lisoso-mas. La degradación de proteínas constituye el últimoeslabón en la cadena de eventos que regulan la expresiónde un gen y determinan las características de una célula.

BIBLIOGRAFÍA

Referencias generalesAlberts B, Bray D, Hopkin K, Johnson A, Lewis J, Raff M,

Roberts K, Walter P: Essential cell biology, 2nd ed. GarlandScience. New York 2004:740.

http://www.ncbi.nlm.nih.gov/omimKrebs JE, Goldstein ES, Kilpatrick ST: Lewin’s Genes X. Jones

and Bartlett Publishers. Boston, Mass., EUA 2010:930.Strachan T, Read AP: Human Molecular Genetics 4th ed.

Garland Sciences. New York 2010:790.www.els.net

Estructura del genomaBhuvanagiri M, Schlitter AM, Hentze MW, Kulozik AE: NMD:

RNA biology meets human genetic medicine. Biochem J2010;430:365–377. doi:10.1042/bj20100699 365

Gerstein MB, Bruce C, Rozowsky JS, Zheng D et al.: What isa gene, post-ENCODE? History and updated definition.Genome Res 2007;17(6):669-681.

Kehrer SH, Cooper DN: Sequencing the Human Genome: NovelInsights into its Structure and Function. In: Encyclopedia ofLife Sciences (ELS). John Wiley & Sons, Ltd: Chichester.(July 2008) DOI: 10.1002/9780470015902.a0001899.pub2

Mattick JS, Makunin IV: Non-coding RNA. 2006. Hum MolGenet 2006, 15, Rev Issue 1, R17 –R29 doi:10.1093/hmg/ddl046

Pesole G: What is a gene? An updated operational definition.Gene 2008;417(1-2):1-4.

Rowen L: Gene Structure and Organization. Encyclopedia ofLife Sciences 2005. John Wiley & Sons, Ltd. www.els.net.doi: 10.1038/npg.els.0005008

Szymanski M, Barciszewski J: Noncoding RNAs in Biology andDisease. In: Encyclopedia of Life Sciences (ELS). JohnWiley & Sons, Ltd: Chichester. (2009) DOI:10.1002/9780470015902.a0021437

Wright MW, Bruford EA: Naming ‘junk’: Human non-proteincoding RNA (ncRNA) gene nomenclature HumGenomics 2011;5(2):90–98.

Zheng D, Frankish A, Baertsch R, Kapranov P et al.:Seudogenes in the ENCODE regions: consensus annota-

tion, analysis of transcription, and evolution. Genome Res2007;17(6):839-851.

Zheng D, Gerstein MB: The ambiguous boundary betweengenes and seudogenes: the dead rise up, or do they? TrendsGenet 2007;23(5):219-224.

ReplicaciónBalakrishnan L, Gloor JW, Bambara RA: Reconstitution of

eukaryotic lagging strand DNA replication. Methods2010;51:347–357.

Bicknell LS, Bongers EM, Leitch A, Brown S et al.: Mutationsin the pre-replication complex cause Meier-Gorlin syn-drome. Nat Genet 2011;43(4):356-359.

Borlado LR, Méndez J: CDC6: from DNA replication to cellcycle checkpoints and oncogenesis Carcinogenesis2008;29(2):237–243. doi:10.1093/carcin/bgm268

Duncker BP, Chesnokov IN, McConkey BJ: The origin recog-nition complex protein family. Genome Biol2009;1100:214. (doi:10.1186/gb-2009-10-3-214)

Ghosh S, Vassilev AP, Zhang J, Zhao Y, Depamphilis ML:Assembly of the human origin recognition complex occursthrough independent nuclear localization of its compo-nents. J Biol Chem 2011;9. [Epub ahead of print]

Guernsey DL, Matsuoka M, Jiang H, Evans S et al.: Mutationsin origin recognition complex gene ORC4 cause Meier-Gorlin syndrome. Nat Genet 2011;43(4):360-364.

Johansson E, Macneill SA: The eukaryotic replicative DNApolymerases take shape. Trends Biochem Sci2010;35(6):339-347.

Labib K: How do Cdc7 and cyclin-dependent kinases triggerthe initiation of chromosome replication in eukaryoticcells? Genes Dev 2010;24(12):1208-1219.

Stallons LJ, McGregor WG: Translesion synthesis polymerasesin the prevention and promotion of carcinogenesis. JNucleic Acids (2010). Article ID 643857, doi:10.4061/2010/643857 pii: 643857.

Zheng L, Jia J, Finger LD, Guo Z, Zer C, Shen B: Functional regu-lation of of FEN1 nuclease and its link to cancer. Nuclei AcidRes 2011;39(3):781–794. doi:10.1093/nar/ gkq884.

Mutación y reparaciónArana ME, Kunkel TA: Mutator phenotypes due to DNA replica-

tion infidelity. Semin Cancer Biol 2010;20(5):304–311.doi:10.1016/j.semcancer.2010.10.003.

Hanawalt PC, Spivak G: Transcription-coupled DNA repair:two decades of progress and surprises. Nat Rev Mol CellBio 2008;9:958-970.

Moldovan GL, D’Andrea AD: How the Fanconi anemia path-way guards the genome. Annu Rev Genet2009;43:223–249.

Rastogi RP, Richa, Kumar A, Tyagi MB, Sinha RP: Molecularmechanisms of ultraviolet radiation-induced DNA dama-ge and repair. J Nucleic Acids 2010:592980. Article ID592980, 32 pages doi:10.4061/2010/592980

Sugasawa K: Xeroderma pigmentosum genes: functions insideand outside DNA repair. Carcinogenesis 2008;29(3):455–465. doi:10.1093/carcin/bgm282

Thoms KM, Kuschal C, Emmert S: Lessons learned from DNArepair defective syndromes. Exp Dermatol 2007;16(6):532-544.

Waters LS, Minesinger BK, Wiltrout ME, D’Souza S, WoodruffRV, Walker GC: Eukaryotic translesion polymerases andtheir roles and regulation in DNA damage tolerance.Microbiol Mol Biol Rev 2009;73(1):134-154. doi:10.1128/MMBR.00034-08

Page 26: Cap 2_Bases Moleculares de La Herencia_Castillo

PREGUNTAS DE AUTOEVALUACIÓN1. ¿Cuáles de las siguientes bases nitrogenadas son derivadas

de la pirimidina y se encuentran en el ácido ribonucleico?A. Adenina y guanina. B. Citosina y guanina. C. Adenina y timina.D. Citosina y uracilo.

( )

2. El tamaño del genoma humano haploide es de:A. 6 000 000 pb. B. 3 x 106 pb. C. 3 000 Mb.D. 3 000 kb.

( )

3. Los genes que codifican para tRNA son un ejemplo de:A. Genes codificantes para polipéptidos.B. Genes para RNA no codificante. C. Heterocromatina facultativa.E. Seudogenes.

( )

4. Durante la replicación del DNA humano la actividadde helicasa la ejercen:A. RFC y PCNA. B. Complejo ORC1-6.C. Complejo MCM2-7.D. CDC6, CTD1 y RPA.

( )

5. Debido a una mutación puntual en la región codificante deun gen que tiene 500 nucleótidos en su ORF, el codónTGG correspondiente al residuo del aa 108 es sustituidopor el triplete TGA en la cadena sentido del gen (5’ 3’)¿cómo será la proteína codificada por el DNA que tieneesa mutación?A. Una proteína de 107 aminoácidos. B. Una proteína de 108 aminoácidos.C. Una proteína de 500 aminoácidos con la secuencia

normal.D. Una proteína de 500 aminoácidos pero con cambio

de un aa.( )

6. Los dímeros de pirimidina producidos por la luz ultra-violeta son reparados en especial por:

A. Escisión de base.B. Escisión de nucleótidos.C. Unión de extremos no homólogos.D. Reparación de bases mal apareadas.

( )

7. Un promotor puede ser definido como:A. El sitio al cual se unen proteínas específicas para

reprimir la transcripción.B. El complejo proteico que ayuda a la RNA polimera-

sa a iniciar la expresión de un gen.C. La secuencia de DNA con la cual interacciona la

RNA polimerasa para iniciar la síntesis de RNA.D. Las secuencias del DNA con las que interaccionan

proteínas para incrementar la tasa de expresión.( )

8. La región del Cap o caperuza:A. Es adicionada a las moléculas de rRNA. B. Se adiciona en el extremo 5’ de los mRNAm.C. Está presente en los transcritos de las RNA pol I yII.

D. Se adiciona durante la terminación de la transcrip-ción del RNAm .

( ) 9. En los organismos eucariontes, los intrones de un gen

corresponden a las secuencias:A. CodificantesB. Traducidas pero no transcritas C. Altamente repetitivas del genomaD. Removidas para formar los mRNA maduros

10. Durante el proceso de traducción de la informacióngenética:A. Se sintetizan los RNAm.B. Participan las RNA polimerasas polimerasas. C. Se procesan los rRNA 45S y proteínas ribosomales.D. Los ribosomas catalizan las formación del enlace

peptídico.( )

Expresión y su regulaciónFischer PM: Cap in hand. Targeting eIF4E. Cell Cycle

2009;(8:16):2535-2541.Lejeune F, Maquat LE: RNA Processing and Human Disorders.

Encyclopedia of Life Sciences 2007. John Wiley & Sons, Ltd.www.els.net. doi: 10.1002/9780470015902. a0005495.

McGlincy NJ, Smith CWJ: Alternative splicing resulting innonsense-mediated mRNA decay: what is the meaning ofnonsense? Trend Biochem Sci 2008;33(8): 385-393.doi:10.1016/j.tibs.2008.06.001

Mendell JT, Dietz HC: Nonsense-mediated mRNA Decay.Encyclopedia of Life Sciences 2005. John Wiley & Sons,

Ltd. www.els.net. doi: 10.1038/npg.els.0005501Millevoi S, Vagner S: Molecular mechanisms of eukaryotic pre-

mRNA 3’ end processing regulation. Nuc Acid Res2010;38(9):2757–2774. doi:10.1093/nar/gkp1176

Scheper GC, van der Knaap MS, Proud CG: Translation mat-ters: protein synthesis defects in inherited disease. Nat RevGenet 2007;8:711-723.

Van Der Kelen K, Beyaert R, Inzé D, De Veylder L:Translational control of eukaryotic gene expression. CritRev Biochem Mol Biol 2009;44(4):143-168.

Wisdom GB: Postranslational modification and human disor-ders. Encyclopedia of Life Sciences 2005. John Wiley &Sons, Ltd. www.els.net doi: 10.1038/npg.els.0005498

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

26 Genetica clínica

Page 27: Cap 2_Bases Moleculares de La Herencia_Castillo

27

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

ANEXO I VARIACIÓN GENÉTICA HUMANA

INTRODUCCIÓN

La diversidad genética es una fuerza importante en laevolución y es un proceso natural que modifica el feno-tipo de los organismos. La alteración en la secuencia denucleótidos del DNA puede ser inducida por factoresambientales (como exposición a luz UV, radiacionesionizantes o a ciertas sustancias químicas) o puede ocu-rrir de manera espontánea por errores en la replicacióndel DNA. En el último decenio ha habido un avancecientífico muy importante en el conocimiento de lavariación genética humana, y se ha asociado con la sus-ceptibilidad, resistencia a diferentes enfermedades oambas, así como con la respuesta individual a la terapiafarmacológica.

El conocimiento de cómo está constituido el genomahumano nuclear fue una de las metas del Proyecto delGenoma Humano (PGH). Iniciado a principios de 1990,el PGH publicó en 2001 un borrador de la secuencia delgenoma humano y en 2004 una secuencia quecomprendía 99.7% de la región eucromática,interrumpida por sólo 300 huecos y con un error de unnucleótido por cada 100 000 bases. La región eucromá-tica abarca 3 Gb y corresponde a la región transcripcio-nal activa del genoma nuclear. Las 200 Mb restantesestán formadas por heterocromatina constitutiva queestá de forma permanente condensada. La heterocroma-tina constitutiva está compuesta de grandes tramos deDNA repetido que son muy difíciles de secuenciar demanera precisa. Por una razón similar, las unidades trans-cripcionales repetidas en tándem que codifican para losrRNA 28S, 18S y 5.8S tampoco fueron secuenciadas.

El estudio de las variaciones del DNA ha contribuidode manera importante a las áreas biomédica y forense, enespecial en el estudio de genes responsables y genes desusceptibilidad para varias enfermedades. Los tipos devariaciones genéticas empleadas en estos estudios hancambiado en los últimos 25 años y pueden clasificarse encinco clases principales: polimorfismos de restricción delongitud variable o RFLP (restriction fragment length poly-morphism), minisatélites o VNTR (variable number oftandem repeat), microsatélites o STR (short tandem repe-at), polimorfismos de nucleótido sencillo o SNP (single-nucleotide polymorphism) y variaciones en el númerode copias o CNV (copy-number variation).

En particular, la secuencia del genoma humano pro-porcionó una mayor comprensión para catalogar e inter-

pretar la variación genética entre los individuos.Alrededor de 99.9% de la secuencia del DNA es idénti-ca entre los diferentes individuos. El restante 0.1% esvariable y aun cuando representa una pequeña propor-ción del genoma total, es responsable de una variaciónsignificativa en el fenotipo. La escala de diversidad en elgenoma humano es muy amplia, desde variacionesmicroscópicas a nivel de cromosomas individuales hastavariaciones a nivel de la secuencia del DNA. Estas últi-mas incluyen más de 10 millones de polimorfismos denucleótido sencillo o SNP. Los polimorfismos genéticosson cambios en la secuencia del DNA que están presen-tes con una frecuencia > 1% de manera natural en unapoblación. La variación estructural visible al microscopioincluye heteromorfismos y rearreglos cromosómicosbalanceados (translocaciones, inversiones, entre otros)que pueden tener tamaños mayores a 3 Mb. Sin embar-go, también existen variaciones submicroscópicas quevan de menos de 3Mb hasta 1 kb en longitud. Recién sehan descrito variaciones estructurales submicroscópicasque comprenden inserciones/deleciones (indel) de esca-sos nucleótidos y variaciones en el número de copias oCNV (figura A1-1). Los minisatélites, microsatélites(figura A1-2) y las inserciones de transposones tambiénhan sido identificadas dentro de esta clase de variantessubmicroscópicas y, en general, requieren de métodosgenómicos para su identificación.

Los minisatélites y microsatélites son secuencias repe-tidas en tándem (una tras otra) compuestas de unidadescortas repetidas. Aunque el tamaño de la unidad de repe-tición determina su clasificación en uno u otro grupo, ala fecha no existe un consenso acerca de la definiciónprecisa de ambos tipos de repetidos. En este capítuloconsideraremos a los STR desde repetidos mononucleó-tido [tractos de poli (A)] hasta los de clase pentanucleó-tida. El tamaño de la unidad de repetición de los VNTRcomprenderá de seis a varias centenas de nucleótidos. Lalongitud completa del tracto de repetidos también varía,siendo de 102 a 103 pb y < 10 a 102 pb para los minisa-télites y microsatélites, respectivamente.

MINISATÉLITES O VNTR

La secuencias minisatélites son altamente polimórficas yal parecer la alta variabilidad es resultado de errores

Page 28: Cap 2_Bases Moleculares de La Herencia_Castillo

durante la replicación del DNA, en donde la polimerasaaumenta o disminuye el número de unidades de repeti-ción; también errores en la recombinación pueden modi-ficar el número de unidades de repetición presentes enun alelo. La variación de estas secuencias es tal que se hacalculado que no existen dos individuos con exactamen-te la misma combinación de alelos minisatélites. En 1985Jeffreys et al., desarrollaron sondas de DNA capaces dedetectar de manera simultánea un gran número de locide minisatélites hipervariables. La hibridación de estassondas con DNA digerido y separado por electroforesis,en condiciones de bajo rigor, detecta un patrón de frag-mentos que es único para individuos no relacionados.Estas propiedades de los minisatélites son la base de losanálisis de huellas génicas o de DNA, por lo que si seanaliza un número suficiente de minisatélites se puedeestablecer un perfil de DNA único para cada persona.De manera adicional, los VNTR contribuyeron de mane-ra importante al estudio de los genes supresores detumor. En la mayoría de estos genes se inactivan ambosalelos en el tejido tumoral (teoría del doble evento, o ini-ciación-promoción). Los VNTR fueron útiles para detec-tar, mediante hibridación tipo Southern, la pérdida deuna porción cromosómica o de un cromosoma completo(pérdida de heterocigosidad); esto es, la desaparición delalelo materno o paterno. El primer análisis sistemático dela pérdida de regiones cromosómicas (análisis de aleloti-pos) fue informado por Vogelstein et al., (1988) en cán-cer colorrectal y a partir de estos resultados se establecióel modelo de carcinogénesis de etapas múltiples en estaneoplasia. Un análisis detallado subsecuente de 17p llevóa la identificación de mutaciones en el gen TP53 y secomprobó que era un gen supresor de tumor.

MICROSATÉLITES O STR

Como en el caso del DNA minisatélite, la variación enel número de repetidos STR se debe a errores cometi-dos por la DNA polimerasa durante la replicación o aeventos de recombinación desigual entre cromosomashomólogos o entre cromátidas hermanas. Los microsa-télites pueden ser: polimorfismos de riesgo en enfer-medades complejas (diabetes, depresión, entre otras),mutaciones patogénicas (en el grupo de enfermedadesconocidas como enfermedades por amplificación demicrosatélites, p. ej., ataxias espinocerebelosas yenfermedad de Huntington) y emplearse en mapas deasociación, ligamiento y genética forense. Los STRpueden participar en forma tan variada como: a) ele-mentos funcionales de unión a factores de transcrip-ción y a otras proteínas que inhiben o promueven laexpresión; b) elementos motivo que afectan la eficien-cia del procesamiento del mRNA; y c) elementos quetienen efectos físicos, tales como variar el espacioentre motivos funcionales o alterar la estructura y laspropiedades de fusión del DNA en sus proximidades.Por estas razones, los STR son a priori muy buenoscandidatos funcionales (figura A1-2).

A partir de la comparación de la secuencias de losgenomas personales de Craig Venter y James Watsonse hizo evidente la gran variabilidad genética interin-dividual. A la fecha, las nuevas técnicas de re-secuen-ciación de genomas han permitido la formación dediversos consorcios internacionales para secuenciar almenos 1000 genomas de individuos de todo el mundo(The 1000 Genomes Project, http://www.1000geno-mes.org/). La motivación principal de estos estudios

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

28 Genetica clínica

Figura A-1. Tipo de variaciones genéticas observadas en lasecuencia y estructura del genoma humano.

ATTGGCCTTAACCCCCGATTATCAGGATATTGGCCTTAACCTCCGATTATCAGGAT

ATTGGCCTTAACCCCCGATTATCAGGATATTGGCCTTAACCCCC TTATCAGGAT

ATTGGCCTTAGGCCTTAA CCCCCGATTATCAGGATATTGGCCTTAA - - - - - CCCCCGATTATCAGGAT

Polimorfismo denucleótido sencillo(SNP)

Interción-deleción(INDEL)

Variación en númerode copias (CNV)

Figura A-2. Tipo de variaciones genéticas observadas en lasecuencia y estructura del genoma humano.

1217

7

4

AMinisaltélite(VNTR)

Microsatélite(STR)

B

5-

3- -3

-3ACAGGGTGTGGG

TGTCCCACACCC

CACACACACACACACGTGTGTGTGTGTGTG

5´-

3´-

-3´-5´

Page 29: Cap 2_Bases Moleculares de La Herencia_Castillo

es mejorar la salud humana y el objetivo a largo plazoes descifrar el código de la variación genética naturalpara entender cómo los cambios en nuestros patronesgenéticos influyen en las características humanas,incluyendo modificación de los estados de salud-enfermedad y respuesta a los tratamientos médicos.

SNP

El polimorfismo más común en el genoma humano esla diferencia de una sola base conocido como o SNP, elcual ocurre aproximadamente cada 300 a 1 000 pb. Seestima que existen > 10 millones de SNP y los cientí-ficos creen que estos cambios constituyen la base de lamayoría de las enfermedades humanas. La mayoría delos SNP tiene dos alelos posibles, por lo que hay unaalta probabilidad de que todos los miembros de unafamilia sean homocigotos para un SNP particular; sólouna minoría son trialélicos. Aunque su bajo polimorfis-mo podría descartarlos como marcadores para estudiosde ligamiento y mapeo génico, las ventajas de los SNPen estudios de asociación son su gran abundancia y elhecho de que pueden ser tipificados por métodos queno requieren electroforesis en gel. La detección delSNP está basada en análisis de hibridación de oligonu-cleótidos, lo que permite el uso de tecnologías automa-tizadas como los chips de DNA.

Dependiendo de la localización del SNP será elefecto que tendrá en la regulación del gen o en el pro-ducto para el cual codifica. Existen polimorfismospoco considerados en los estudios de asociación que selocalizan en las regiones transcritas de los genes, afec-tan las funciones del RNA y en conjunto se denomi-nan SNP estructurales del RNA (rSNP). A partir delas investigaciones de SNP relacionados conrasgos/enfermedades en estudios de asociación delgenoma completo o GWAS (Genome Wide AssociationStudies) se sabe que 9% del total de los SNP están enregiones codificantes y son no sinónimos; 43% de losSNP se localizan en regiones intergénicas; 49% sonrSNP (incluyendo 2% de SNP sinónimos, 2% ubicadosen regiones no traducidas 5 y 3 , y 45% de SNP intró-nicos). Los grupos de SNP vecinos en un mismo cro-mosoma se heredan en bloques y este patrón de SNPen un bloque se conoce como haplotipo. Para caracte-rizar este tipo de variación en las poblaciones se desa-rrolló el proyecto HapMap, el cual será mencionadoen la parte final de este apartado.

INDEL

Los polimorfismos de indel se encuentran en promediocada 7.2 kb de DNA en el genoma humano y su tamañopuede ser de 1 a 10 000 nucleótidos que están elimina-dos o insertados en la secuencia de tipo silvestre. Su con-tribución en la divergencia de la secuencia entre losgenomas humano y de chimpancé es mayor que la de loscambios nucleotídicos (3% vs 1.2%). Se han identificadomás de 840 000 indel que afectan poco más de 7 000genes humanos (> 11 000 transcritos). Los análisis fun-

cionales de zonas exónicas ricas en indel revelan produc-tos génicos con actividades de regulación a nivel detranscripción y traducción. De esta manera se sugiereque las indel contribuyeron a rasgos únicos de la especieal causar cambios a nivel de RNA o proteína.

Existen cinco clases principales de indel, incluyendo1) inserciones y deleciones de un solo par de bases, 2)expansiones monoméricas de un par de bases, 3) expan-siones de multipares de bases de 2 a 15 pb de unidadesde repetición, 4) inserciones de transposones y 5) indelque contienen secuencias de DNA aleatorias.

Al igual que los SNP y las CNV, las variaciones en losindel son de gran interés porque pueden alterar caracte-rísticas y ocasionar enfermedades. Las nuevas tecnologí-as de secuenciación genómica de “la siguiente genera-ción” (next generation) junto con los proyectos de secuen-ciación del exoma han permitido identificar un grannúmero de indel en regiones codificantes sugiriendo quela mayoría de los humanos porta una carga genéticasubstancial de estas variaciones. Los indel han sidomenos estudiados que los SNP; sin embargo, aquelloslocalizados en regiones codificantes de seguro tendránun impacto importante en la biología y en las enferme-dades humanas. Una de las enfermedades genéticashumanas más estudiada, la fibrosis quística, por locomún es causada por un indel dentro del gen CFTR. Ladeleción en fase de tres pares de bases elimina un amino-ácido (fenilalanina) que abole la función del gen y pro-duce la fibrosis quística. Por otro lado, los indel que ocu-rren en regiones promotoras alteran la expresión del gencorrespondiente.

En general, el DNA del genoma humano tiene unacopia de las regiones autosómicas (heredada de cada pro-genitor) en cada cromosoma. Como resultado de lasecuenciación sistemática de genomas humanos median-te el uso de microarreglos de hibridación genómica com-parativa (CGH) se descubrió que muchas regiones gené-ticas presentan variación en el número de copias o CNV(más o menos de dos copias) y se amplió el espectro delas variantes estructurales y de las CNV para incluir aeventos más pequeños (mayores de 50 pb).

CNV

Las CNV corresponden a segmentos de DNA, repetidosen un número de copias bajo, de 1kb a varias megabasesde longitud que contienen secuencias codificantes y nocodificantes. Las CNV constituyen al menos 12% delgenoma humano y contribuyen más a la diversidad genó-mica entre los individuos que los SNP, si se considera elnúmero de nucleótidos implicado (figura A1-1). LasCNV pueden ser heredadas o pueden haber ocurrido denovo en la persona cuyo genoma está siendo examinado.Algunas pueden no causar problemas médicos, peroaquéllas que incluyen regiones codificantes pueden aso-ciarse con enfermedades monogénicas o dando suscepti-bilidad o resistencia a enfermedades complejas y modifi-cando la respuesta a fármacos. Cuando las CNV alteranel número de copias de un gen presente también se lesconoce como cambios en la dosis génica. La alteración enla dosis génica puede ser de ganancia de función como©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Bases moleculares de la herencia 29

Page 30: Cap 2_Bases Moleculares de La Herencia_Castillo

consecuencia de la duplicación o multiplicación de unoo varios exones e incluso de gen (es) completo (s) en laregión que abarca la CNV; en contraste, los eventos dedeleción producen una pérdida de función. En resumen,el cambio en la secuencia nucleotídica de un gen (SNP)o en su número de copias (CNV) puede conducir a cam-bios en la secuencia de sus aminoácidos o en la cantidadde una proteína y alterar su acción enzimática, su estabi-lidad o su capacidad de unión a otras moléculas. El cua-dro A1-1 contiene algunos ejemplos de variaciones desecuencia y estructurales del genoma humano.

PRINCIPALES BASES DE DATOS PÚBLICAS PARA EL MANEJO DE DATOSDE VARIABILIDAD GENÉTICA

A un decenio del PGH una gran cantidad de SNP, indely CNV comunes en el genoma humano están disponi-bles en las bases de datos públicas. En la página electró-nica de NCBI (National Center for BiotechnologyInformation www.ncbi.nlm.nih.gov) se encuentra la basede datos de SNP denominada dbSNP. Además de datos

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

30 Genetica clínica

Cuadro A1-1. Ejemplos de variaciones genéticas de secuencia y estructurales (SNP, indel y CNV) con variación feno-típica normal y algunas asociadas con fenotipo clínico

GEN/producto

CCR5 (Receptor 5de quimiocina conmotivo C-C)

DARC(Antígeno Duffy)

HBG2 (Globina ")

TFR2(Receptor de latransferrina)APOE (Apolipoproteína Ealelo épsilon 4)HFE (Gen de lahemocrormatosis)

CYP17A1 (gen quecodifica para elpolipéptido 1 delcitocromo P450,familia 17,subfamilia A)DRD2(Receptor 2 de ladopamina)CAPN10 (Calpaína)D. Ejemplos de CNV

RHD(Grupo sanguíneoRh)

CCL3L1/CCL4L1(ligando 3/4 dequimiocina conmotivo C-C, similaral 1)FCGR3 (fragmentoFc de IgG, receptorIII o CD16)

Enfermedad asociada

Progresión aceleradaa SIDA en linfocitos ThumanosResistencia a lamalaria por P. vivaxen individuos deraza negraTalasemia alfa enmelanesios

Hemocromatosis Tipo III

Es un factor de riesgopara enfermedad deAlzheimerHemocromatosis

Hipertensión

Anorexia nerviosa

Diabetes mellitus tipo II

Sensibilidad al gruposanguíneo Rhesus p.ej.anemia hemolítica delrecién nacido cuando elfeto es Rh (+) y la madrees Rh (-)Susceptibilidad disminuidapara desarrollar SIDA

Lupus eritematososistémico y otrasenfermedades autoinmunes

Fenotipo

Sobreproducción deCCR5

Pérdida de laexpresión de DARCen eritrocitos

Ganancia de funciónde un sitio GATA-1 ypérdida de laexpresión de laglobina "

Patogénico

Probablementepatogénico

Probablementedañina

Deficiencia de17-alfa-hidroxilasa/17, 20-liasa

Afecta eficiencia dela transcripción delgenND

0 CNV produceausencia delantígeno D

Riesgo reducido deinfección por virusde HIV

Glomerulonefritis

Elemento derespuesta afectadoNF B

GATA-1

GATA-1

NA

NA

NA

NA

NA

NA

Tamaño

6 kb

ND

>5 kb

Posición/variante

-208G/T

-46C

149C/T

2110A/C [Q690P]

388T/C [C112R]

187C/G [H63D]

157_159delTTC[Phe53del]

-/C Indel -141

Indel 19

Variación en el número de

copias0 a 2

0 a 14

0 a 14

rs (dbSNP)/locus

rs2734225en 3p21.31

rs1800846 en1q21 a q22

SNP195 en11p15.5

rs80338889 en7q22

rs429358 en19q13.2

rs1799945 en6p21.3

-TTC en 10q24.3

rs1799732 en11q23

En 2q37.3

Tipo

Deleción en1p36

VNTR en17q21.1 y q12,respectivamente

Del/dupl en1q23.3

A. Ejemplos de rSNP

B. Ejemplos de SNP

C. Ejemplos de indel

NA.- no aplica; ND.- no determinado. (Wain LV et al 2009, Eichler EE et al 2007, Hernández-Romano JH et al 2009).

Page 31: Cap 2_Bases Moleculares de La Herencia_Castillo

sobre SNP, contiene información de polimorfismos tipomicrosatélite e indel de pequeña escala. La dbSNP pro-vee información de frecuencias específicas por pobla-ción, datos de genotipos, condiciones experimentales yligas a mapas [http://www.ncbi.nlm.nih.gov/snp]. Otrabase de datos que sirve para el almacenamiento centralde datos de variación genética humana es la HGV(Human Genome Variation database). Esta base de datosprovee datos de estudios de asociación, resume todas lasvariaciones de secuencia conocidas en el genoma huma-no y facilita la investigación de cómo los genotipos afec-tan en enfermedades comunes, en la respuesta a fárma-cos y en otros fenotipos complejos [http://www.gwas-central.org].

El proyecto internacional del HapMap es un mapa dehaplotipos del genoma humano y fue posible gracias a laelucidación de nuestro genoma completo. Los bloques dehaplotipos pueden contener una gran cantidad de SNP,aunque sólo algunos pueden ser suficientes para identificarde manera inequívoca los haplotipos de un bloque. ElHapMap es un mapa de estos bloques de haplotipos y los

SNP específicos que identifican los haplotipos se conocencomo SNP etiqueta (tag SNP). Éstos SNP etiqueta reducenel número requerido de 10 millones SNP existentes a solo 500 000 SNP en un GWAS para investigar un fenotipo.Por ello, el HapMap es una herramienta que permite a losinvestigadores encontrar genes y variaciones genéticas queafectan los estados de salud y enfermedad en el humano[www.hapmap.org].

El Proyecto de los 1 000 Genomas es una colabora-ción internacional que está en desarrollo y cuyo objetivoprincipal es producir un catálogo público de la variacióngenética humana (2 500 genomas de 25 poblaciones),incluyendo SNP y variantes estructurales, junto con sushaplotipos. Este recurso apoyará los GWAS y otros estu-dios de investigación médica. Los investigadores tambiénpodrán estudiar recombinación, selección natural, asícomo estructura y mezclas de poblaciones en este catá-logo [http://www.1000genomes.org/]. El cuadro A1-2resume los principales navegadores y bases de datospúblicas que proporcionan información relevante de lasdistintas clases de variaciones genéticas.

Bases moleculares de la herencia 31Cuadro A1-2. Principales navegadores y bases de datos (BD) públicas que contienen información relevante

de las distintas clases de variaciones genéticasBase da datos

Navegador de genomasde la UCSC (Universityof California, SantaCruz)Navegador de losInstitutos Nacionales deSalud de los EUA, NCBI(The National Center forBiotechnologyInformation) Instituto Europeo deBioinformática, partede los Laboratorios deBiología MolecularEuropeos (EMBL-EBI)Navegador ENSEMBL

BD de desbalancescromosómicos y fenotipo en humanos, empleando recursos de ENSEMBL,DECIPHERProyecto de la variaciónen el número de copias

Base de datos devariantes genómicasConsorcio WellcomeTrust de casoscontroles

NIEHS SNP

DescripciónEste sitio contiene secuencias de referencia y ensambladosen borrador para una gran colección de genomas. Tambiénprovee portales para la Enciclopedia de los Elementos deDNA (ENCODE) y Proyectos del NeandertalEs una de las BD biomédica más completa para una grancolección de genomas. Contiene sistemas dealmacenamiento y herramientas de análisis para biologíamolecular, bioquímica y genética

Consorcio internacional que provee datos genómicos dediversos organismos, junto con una batería de herramientasde bioinformática

ENSEMBL es un proyecto de unión entre EMBL - EBI y elInstituto Wellcome Trust Sanger para desarrollar un sistemaque produce y mantiene anotaciones de genomas deeucariontes seleccionadosEsta BD contiene información de desbalances cromosómicossubmicroscópicos, reúne toda la información clínicarelacionada con microdeleciones/duplicaciones/inserciones,translocaciones e inversiones y la despliega en el mapa delgenoma humanoProyecto dirigido por el Instituto Sanger que incluye datos de CNV en humano, obtenidos mediante nuevas tecnologíasde secuenciación, análisis de microarreglos, citogenética,genética de poblaciones, genómica comparativa ybioinformáticaCatálogo curado de variación estructural (CNV, indel) en elgenoma humanoIdentifica variaciones de secuencia que tienen influenciasobre las causas principales de morbi-mortalidad en elhumano a través de GWAS (Genome Wide AssociationStudies)BD de SNP que se enfoca a relaciones entre exposicionesambientales, variaciones de secuencia inter-individuales engenes humanos y riesgo a enfermedades en poblaciones delos EUA

Dirección electrónica de la páginahttp://genome.ucsc.edu/

http://www.ncbi.nlm.nih.gov/

http://www.ebi.ac.uk/

http://www.ensembl.org/

http://www.sanger.ac.uk/PostGenomics/decipher/

http://www.sanger.ac.uk/humgen/cnv/

http://projects.tcag.ca/variation/

http://www.wtccc.org.uk

http://egp.gs.washington.edu

Page 32: Cap 2_Bases Moleculares de La Herencia_Castillo

BIBLIOGRAFÍA

Chen FC, Chen CJ, Li WH, Chuang TJ: Human-specific inser-tions and deletions inferred from mammalian genomesequences. Genome Research 2007;17:16-22.

Henrichsen CN, Chaignat E, Raymond A: Copy numbervariants, diseases and gene expression Human MolecularGenetics 2009;18:R1–R8.

Lander ES, Linton LM, Birren B, Nusbaum C et al.: Initialsequencing and analysis of the human genome. Nature2001;409:861-921.

Mills RE, Pittard WS, Mullaney JM, Farooq U, Creasyet TH etal.: Natural genetic variation caused by small insertions

and deletions in the human genome. Genome Research2011. doi/10.1101/gr.115907.110.

Mullaney JM, Mills RE, Pittard WS, Devine SE: Small inser-tions and deletions (INDELs) in human genomes. HumanMolecular Genetics 2010;19;R2:131-136.

Ng PC, Samuel Levy, Jiaqi Huang, Timothy B. Stockwell, BrianP. Walenz et al.: Genetic Variation in an IndividualHuman Exome. PLOS Genetics 2008;4:8:1-15.

Venter JC, Adams MD, Myers EW, Li PW, Richard J et al.: Thesequence of the human genome. Science 2001;291:1304-1351.

Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L et al.:The complete genome of an individual by massively para-llel DNA sequencing. Nature 2008;452:872-877.

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

32 Genetica clínica

ANEXO II DNA mitocondrial humano: polimorfismo y

variabilidad en las poblaciones

Rosenda I. Peñaloza Espinosa, Ricardo M. Cerda Flores

El genoma mitocondrial (mtDNA) fue descrito por pri-mera vez por Nass y Nass en 1963, secuenciado porAnderson et al., en 1981 y revisado por Andrews et al.,(1999). El mtDNA presenta polimorfismos de un solonucleótido en la secuencia codificante y dos regionesaltamente polimórficas (HV1 y HV2 que correspondena nucleótidos -nt- 16090-16362 y 76-340, respectiva-mente), ubicadas en la región control, (asa D o “D-loop”). De acuerdo con Ford (1940) un polimorfismo esla presencia de dos o más formas alélicas de un gendonde la más rara tiene una frecuencia mayor a 1% en lapoblación general y no alteran la función génica.

Utilizando la técnica de RFLP, diferentes investigado-res mostraron diferencias en patrones de sitios polimór-ficos a los que se denominó haplogrupos e informaronque son específicos de las poblaciones en todos los con-tinentes. En África, de 70 a 100% de las poblaciones delsubsahara están representadas por el haplogrupo L y sub-tipos. En Asia y la Siberia los mtDNA pertenecen a loshaplogrupos C, D, G y E, que son miembros de loshaplogrupos M, mientras que para el resto de Asia loshaplogrupos son A, B, F, X6 y X7. En Europa, 99% delmtDNA pertenece a los 10 haplogrupos (H, I, J, K, M, T,U, V, W y T) y en nativos de América sólo cinco haplo-grupos de Asia son observados (A, B, C, D y X). La des-cripción detallada de todos estos haplogrupos se observaen el cuadro A2-1.

En México se han realizado estudios tanto en pobla-ciones indígenas (Peñaloza-Espinosa et al., 2007;Sandoval et al., 2009; Kemp et al., 2010; Moran et al.,2011) como mestizas mexicanas (Green 2000;Guardado-Estrada 2009) encontrando una amplia varia-ción entre ellas que va de 30 a 87.5% para el haplogru-po A, de 14 a 53% para el B, de 0 a 31% para C y de 0 a12% para el D. El haplogrupo X se informó en dospoblaciones (Peñaloza-Espinosa et al., 2007) y al hacer lasecuenciación sólo se corroboró uno de ellos(Tarahumara). En cuanto a haplogrupos europeos y afri-canos, éstos se observaron en baja proporción en pobla-ciones indígenas y mayor en mestizas (cuadro A2-2).

Estudios recientes de secuenciación completa delmtDNA demostraron que en América sólo se encuen-tran los haplogrupos A2, B2, C1 y D1 (Achili et al.,2009; Sandoval et al., 2009; Kemp et al., 2010).

Los datos obtenidos permitieron realizar filogeniasmoleculares donde se compararan segmentos homólo-gos, dentro de una misma población, o entre poblacionesde una misma especie. Las relaciones filogenéticas entrepoblaciones se representan por árboles filogenéticos queconsisten en nodos conectados por ramas.

Existen diferentes procedimientos para la reconstruc-ción filogenética, y uno de los más utilizados es el de“máxima parsimonia” o de “evolución mínima” que signi-fica que la evolución ocurre de manera que los cambios

Page 33: Cap 2_Bases Moleculares de La Herencia_Castillo

en los nucleótidos son igualmente probables en todas lasposiciones, lo que significa que el árbol elegido es el querequiere el mínimo número de mutaciones para explicarla distribución de los caracteres entre los individuos aestudiar.

Uno de los primeros estudios de análisis de variabili-dad mitocondrial en poblaciones humanas fue el deCann et al., (1987), quienes analizaron individuos deAsia, Australia, Nueva Guinea, Europa y África encon-trando resultados que les permitieron formular la hipó-tesis de la “Eva mitocondrial” donde resaltaron tresaspectos principales:

1. Que todos los tipos de mtDNA actuales se remontan aun ancestro único.

2. Que este ancestro es de origen africano.3. Que surgió hace alrededor de 200 000 años.

Esta interpretación está basada en el principio de coales-cencia que asume la existencia de un solo origen paratodos los organismos vivos, por lo que la variación encualquier segmento del DNA mitocondrial (o nuclear)en las generaciones presentes deben proceder en ultimainstancia de un único ancestro que existió en generacio-nes previas. Tal ancestro femenino fue miembro de lapoblación donde el resto de los linajes mitocondriales sefueron perdiendo con el paso de las generaciones, y sólorepresenta el punto donde los linajes convergen. Talhipótesis ha sido muy controvertida debido a los méto-

dos de reconstrucción filogenética; sin embargo, ha servi-do de apoyo a otros estudios tanto de análisis de mtDNAcomo de otros marcadores nucleares. Más tarde esta teo-ría fue apoyada por otros autores, y se realizaron otrosestudios en diferentes poblaciones de los cinco continen-tes incluyendo las amerindias. Por ejemplo, en África seencuentran distintos haplogrupos donde el L es el más©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Bases moleculares de la herencia 33

Figura A2-1. Representación esquemática del mtDNA. En la regióncontrol están las regiones más polimórficas, además del origen dereplicación de la cadena pesada (OH), el origen de la transcripciónde la cadena pesada (HSP) y de la ligera (LSP). El origen de replica-ción de la cadena ligera (OL) se encuentra entre la secuencia de lostRNAa N y C. Las proteinas ND-1 a ND6 incluyendo ND4L son delcomplejo I, Cyp-b del complejo III, COI, COII del complejo IV y dossubunidades de la ATPasa6y8 del Complejo V. Los tRNA están repre-sentados por las letras P, T, E, L, S, H, R, G, B, K, D, A, N, C, Y, W, I,Q, M, L, V y F.

0h

Región controlF T

Cyt b

cadena H

ND5

LS

H

ND4

ND4LR

ND3GCOIII

ATPasa6

ATPasa8

KCOIID

COI0L

B

cadena LA

NCY

Q

RNA16S

L

ND1I

M

ND2

W

P

E

V RNa12S

Cuadro A2-1. Haplogrupos del DNAmt humanoHaplotipo

A

B

C

D

X

E

F

G

H

I

J

K

L

M*

T

U

V

W

X

Oligonucleótidos(sentido,

antisentido)534 a 553, 725 a 7068 150 a 8 166, 8 366 a 8 34513 197 a 13 213, 13 403 a 13 3845 151 a 5 170, 5 481 a 5 464534 a 553, 725 a 70613 197 a 13 213,13 403 a 13 3845 151 a 5 170,5 481 a 5 46410 270 a 10 290, 10 579 a 10 5577 367 a 7 384,9 172 a 9 15416 453 a 16 472,1 696 a 1 6773 108 a 3127,5 917 a 5 8986 890 a 6 999,7 131 a 7 1151 615 a 1 643,1 894 a 1 8748 188 a 8 207,8 366 a 8 3459 911 a 9 932,10 107 a 10 08813 583 a 13 605,13 843 a 13 8248 829 a 8 845,9 184 a 9 163

12104-12124, 12338-12309

3 388 a 3 408,3 717 a 3 70110 270 a 10 290,10 579 a 10 55713 172 a13 190,13 403 a 13 38415 409 a 15 428,15 701 a 15 68212 104 a 12 124,12 338 a 12 3094 308 a 4 325,4 739 a 4 7208 188 a 8 207,8 366 a 8 3458 829 a 8 845,9 184 a 9 1631 615 a 1 643,1 894 a 1 897

Población

América, Asia

América, Asia

América, Asia

América, Asia

Asia, América

Asia

Asia

Asia

Europa

Europa

Europa

Europa

Africa

América, Asia

Europa

Europa

Europa

Europa

Europa

SitioPolimórfico

+663 HaeIII

9pb-deleción

+13 262 AluI

-5 176 AluI

-663 HaeIII

+13 262 AluI

+5 176 AluI

+10 397 AluI

-7 596 HhaI

-1 206 HincII

+4 830 HaeIII

-7 025 AluI

-1 715 DdeI

+8 249 AvaII

+10 028 AluI

-13 704 BstOI

-9 052 HaeII

+12 308 HinfI

+3 592 HpaI

+10 397 AluI

+13 366BamHI+15 606 AluI

+12 308 HinfI

-4 577 NlaIII

+8 249 AvaII

-8 994 HaeIII

-1 715 DdeI

*Mestizos = C + D + E + G.

Page 34: Cap 2_Bases Moleculares de La Herencia_Castillo

frecuente con subgrupos L1, L2 y L3. En Europa y Asiason frecuentes los haplogrupos M y N que se originaronen el este de África y a continuación se dispersaron a losdiferentes continentes sobre todo a Asia, Europa. Eneuropeos en general (caucásicos), también son frecuen-tes los haplogrupos H, I, J, N1b, T, U, V y W, mientras enla región siberiana predominan los haplogrupos G, Y y Zy en América los más frecuentes son los haplogrupos A2,B2, C1, D1 y X originados en Asia.

El análisis de componentes principales (PCA) asícomo la construcción de redes son herramientas parahacer estudios poblacionales (figura A2-2).

Por otra parte, se ha informado de una correlaciónentre los haplotipos mitocondriales con el lenguaje enalgunas poblaciones como las europeas, pero no en otrascomo las amerindias donde sólo correlaciona con laregión ya que la llegada de españoles y africanos en laépoca de la colonia cambió la historia (Sandoval et al.2009; Kemp et al., 2010), datos que correlacionan conotros marcadores autosómicos y del cromosoma Y(Cerda-Flores et al., 2002 a y 2002b; Buentello et al.,2005 y 2008; Guardado-Estrada et al., 2010; Gorostiza yGonzález-Martin 2010).

Las secuencias fundadoras han divergido a medidaque los grupos humanos se establecieron en las distintasregiones geográficas del mundo como lo demuestran loshaplogrupos mitocondriales específicos de cada conti-nente (figura A2-2). De esta manera ha sido posible ras-trear la historia de las poblaciones humanas a través delas mutaciones acumuladas en los linajes de mtDNA(Alvarez-Iglesias 2005).

De acuerdo a los resultados informados, podemosconcluir que el Homo sapiens tiene un origen de alrede-dor de 200 000 años donde las poblaciones más antiguasson subsaharianas caracterizadas por variantes delmacro-haplogrupo L. De ahí salieron a Eurasia hacecerca de 80 000 años por el estrecho de Omán hasta lle-gar a Australia y Nueva Guinea en migraciones indepen-dientes. Otro grupo pobló Asia hace 50 000 años aproxi-madamente, quienes llegaron a través de los grandes ríos(modelo centrípeto de expansión). Más tarde (45 000años) se establecieron en Europa occidental donde esfrecuente el haplogrupo U5 y otras variantes que hacensuponer un segundo doblamiento hace 31 000 años. ElContinente Americano se pobló con grupos humanosprocedentes de Asia hace cerca de 18 000 años y por

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.

34 Genetica clínica

Cuadro A2-2. Porcentaje promedio de haplotipos de mtDNA en poblaciones mexicanasHaplogrupo

ABCDAfricanoEuropeoDesconocidoN ind./n pob

Guardado et al. 201051.117.818.55.90.76.00270/17

Green et al. 2000

33.626.523.35.84.55.40.9223/2

Moran et al. 2011

42.723.620.44.5--8.8110/2

Kemp et al. 2010*

49.028.017.15.60.20.10597/11*

Sandoval et al. 2009

50.517.628.52.7

000.6477/11

Peñaloza et al. 2007

51.228.811.15.30.600513/11

N ind./n pob = número de individuos en numero de poblaciones; *Sólo se tomó en cuenta a las poblaciones mexicanas.

Figura A2-2. Representación de las migraciones humanas a través del mtDNA (adaptado de Mitomap).

50 000

150 000200 000

60 00080 000 80 000

31 000

C+D AG

BF

12 000-15 000

15 000

B

A.C.D

A.C.DB

TEXTO ILEGIBLE

Page 35: Cap 2_Bases Moleculares de La Herencia_Castillo

último llegaron las islas del pacífico hace cerca de 8 000años (Gorostiza y González-Martin, 2010). Estos estu-dios han sido utilizados también en medicina forense yrelacionados con diversas patologías humanas.

BIBLIOFRAFÍA

Achilli A, Perego UA, Bravi CM et al.: The phylogeny of thefour pan-American MtDNA haplogroups: implications forevolutionary and disease studies. PLoS ONE 2008;3(3):e1764.

Álvarez IV, Mosquera MA, Cerezo M et al.: New Populationand Phylogenetic Features of the Internal Variation withinMitochondrial DNA Macro-Haplogroup R0. PLoS ONE2009;4(4):e5112. doi:10.1371/journal.pone

Andrews RM, Kubacka I, Chinnery PF, Lightowlers RN,Turnbull DM, Howell N: Reanalysis and revision of theCambridge reference sequence for human mitochondrialDNA. Nat Genet 1999;23:147.

Buentello ML, Peñaloza ERI, Salamanca GF, Cerda FRM:Genetic admixture of eight Mexican indigenous popula-tions: based on five polymarkers, HLA-DQA1, ABO, andRH loci. Am J Hum Biol 2008;20:647-650.

Cerda FRM, Budowle B, Jin L, Barton SA, Deka R,Chakraborty R: Maximum likelihood estimates of admix-

ture in Northeastern Mexico using 13 short tandem repe-at loci. Am J Hum Biol 2002b;14:429-443.

Cerda FRM, Villalobos TMC, Barrera SHA et al.: Geneticadmixture in three mexican mestizo populations based onD1S80 and HLA-DQA1 loci. Am J Hum Biol2002a;14:257-263.

Gorostiza A, González MA: Historia Natural del ADN mito-condrial humano. En: Fósiles y moléculas. Aproximacionesa la historia evolutiva de Homo sapiens. AntonioGonzález-Martín (Editor). Memorias de la Real Sociedadespañola de Historia Natural, Segunda época, Tomo VIII,año 2010. ISSN: 1132-0869. ISBN: 978-84-936677-5.

Kemp BM, González OA, Malhi RS, Monroe C et al.:Evaluating the Farming/Language Dispersal Hypothesiswith genetic variation exhibited by populations in theSouthwest and Mesoamerica. Proc Natl Acad Sci USA2010;107:6759-6764.

Morán BV, Peñaloza ERI, Castro SE et al.: Genetic structureof three Native Mexican communities based on mtDNAhaplogroups, and ABO and Rh blood group systems. RIC2011 (En prensa).

Peñaloza ERI, Arenas AD, Cerda FRM et al.: Characterizationof mtDNA haplogroups in 14 Mexican indigenous popu-lations. Hum Biol 2007;79:313-320.

Sandoval K, Buentello ML, Peñaloza ER et al.: Linguistic andmaternal genetic diversity are not correlated in NativeMexicans. Hum Genet 2009;126:521-531.

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.Bases moleculares de la herencia 35

ANEXO III Fundamentos y aplicaciones de las principales

técnicas de diagnóstico molecular en enfermedades mendelianas

Miguel Ángel Alcántara Ortigoza, Ariadna Estela González del Ángel, José Velázquez Aragón

La biología molecular, rama de la biología que se encarga delestudio de las moléculas que contienen información bioló-gica, ha revolucionado en los últimos tres decenios el diag-nóstico de enfermedades mendelianas. El desarrollo y sim-plificación de las técnicas para la identificación de mutacio-nes en genes causantes de estas patologías, ha llevado a quecada vez sea mayor el número de laboratorios en los que serealiza el diagnóstico molecular como un proceso sistemáti-co y a un costo cada vez más accesible. El estudio por bio-logía molecular de un paciente con una entidad mendelia-na permite en muchos de los casos:

a) Establecer un diagnóstico certero en entidades donde sedificulta el diagnóstico clínico y de laboratorio/gabinete

por ejemplo en la enfermedad de Alzheimer de iniciotemprano, el síndrome de Rett y el grupo extenso de lasataxias espinocerebelosas.

b) La identificación inequívoca de individuos portadores,en especial en trastornos autosómico recesivos comofibrosis quística o recesivos ligados al cromosoma Xcomo la hemofilia A.

c) Proporcionar diagnóstico prenatal a parejas con un altoriesgo de recurrencia para una entidad mortal o limitan-te de la supervivencia como en atrofia músculo espinaltipo I, el síndrome de Hunter o en la distrofia muscularde Duchenne.

d) Establecer un diagnóstico presintomático en sujetos quepresentan el genotipo de riesgo, pero que aún no mues-

Page 36: Cap 2_Bases Moleculares de La Herencia_Castillo

tran manifestaciones clínicas y en los cuales se puedeestablecer un manejo preventivo, tal y como ocurre enlos síndromes de cáncer familiar como la neoplasia endó-crina múltiple tipo 2, el carcinoma de mama y ovariofamiliar o el síndrome de Lynch.

e) Correlacionar el genotipo presente en el paciente con elfenotipo esperado, como ocurre en la glucogenosis tipo IIo enfermedad de Pompe, en la cual los afectados con ungenotipo heterocigoto compuesto del gen GAA con unamutación grave y una leve como la mutación intrónicac.-32-13T > G, presentan un fenotipo atenuado o tardíode la enfermedad debido a la presencia de la mutaciónleve. Más aún, el genotipo podría predecir la respuestaterapéutica a nuevos fármacos como la sapropterina, uncofactor enzimático que actúa también como moléculachaperona de la enzima fenilalanina-hidroxilasa (PAH),y cuya administración a pacientes con fenilcetonuria conal menos un alelo PAH con la mutación p.Arg261Glu,les predice un mejor control de las concentraciones san-guíneas de la fenilalanina o incluso hasta una dietamenos restringida. Por último, el genotipo puede en oca-siones predecir o explicar el modo de herencia esperadopara una misma enfermedad, como en las #-talasemiasdonde mutaciones amorfas ubicadas en el promotor o losprimeros dos exones del gen de #-globina se heredan deforma autosómica recesiva, mientras que las mutacionesantimorfas o con efecto dominante negativo ubicadas enel exón 3, se manifiestan y heredan de forma autosómi-ca dominante.

La gama de aplicaciones y utilidades del estudio molecu-lar en este tipo de pacientes es muy vasta, por lo que acontinuación se describirán de forma breve los funda-mentos de las técnicas moleculares más empleadas y seejemplificará su aplicación con un trastorno monogénicoen particular.

OBTENCIÓN DE LA MUESTRA

Para la realización de las pruebas moleculares es necesa-ria la purificación de los ácidos nucleicos a analizar. Porlo general la molécula de elección es el DNA, ya que enella se pueden identificar en la mayoría de los casos loscambios o mutaciones responsables de una patología.Cualquier célula nucleada como leucocitos totales desangre periférica con anticoagulante EDTA o ACD, célu-las de descamación de mucosa oral, tejidos embebidos enparafina, gotas de sangre seca depositadas en papel filtro,amniocitos o biopsias de vellosidades coriales son fuen-tes de DNA genómico para la realización de análisismoleculares.

En algunos casos, cuando se requiere analizar el efec-to de una mutación que altera el procesamiento delRNA o la expresión del gen, se requiere analizar el trans-crito maduro o mRNA. Para la obtención del mRNA deinterés se requiere una muestra de tejido idealmente nofijado y fresco en donde el gen mutado se exprese, siem-pre y cuando la toma de muestras sea lo menos invasivay riesgosa posible y evaluando el costo-beneficio de larealización de la prueba molecular. Una vez purificado elmRNA es convertido a DNA complementario o cDNApor un procedimiento conocido como retrotranscrip-

ción. El cDNA generado es idéntico a la secuencia delgen presente en el mRNA maduro (sólo exones). EstecDNA es más estable que el RNA y puede ser analizadomediante las mismas técnicas que el DNA genómico.

Reacción en cadena de la polimerasa(PCR)La reacción en cadena de la polimerasa o PCR (polyme-rase chain reaction) es una técnica que conlleva la ampli-ficación de una secuencia especifica de DNA in vitro.Esta técnica fue desarrollada por Kary Mullis en 1983 ysu impacto en la investigación genética fue inmediatodado que permite amplificar millones de veces y demanera dirigida una secuencia específica del genoma. LaPCR es uno de los pasos iniciales en muchas técnicas queen la actualidad se emplean de forma sistemática en laidentificación de mutaciones génicas, como son lasecuenciación automatizada tipo Sanger y la amplifica-ción múltiple de sondas ligadas o MLPA, las cuales sedescriben más adelante.

La técnica de PCR requiere una mezcla de reacciónque contiene una solución amortiguadora, un cofactorenzimático como el cloruro de magnesio, una DNA poli-merasa DNA-dependiente termoestable (Taq polimera-sa), una mezcla equimolar de desoxinucleósidos trifosfa-to de adenina, guanina, citosina y timina, así como dosmoléculas de oligonucleótidos de cadena sencilla de 16 a24 nucleótidos de longitud o cebadores, los cuales deli-mitan el fragmento que se desea amplificar, ya que con-tienen la secuencia complementaria a los extremos de lasecuencia génica de interés. La reacción de PCR se llevaa cabo por medio de una serie de cambios de temperatu-ra programados de forma automática en un equipo deno-minado termociclador, los cuales permiten los pasosrequeridos para la amplificación del fragmento de inte-rés (figura A3-1). El ciclo de temperaturas se repite entre25 a 35 veces y dado que en cada ciclo se produce eldoble de la cantidad de copias de DNA que existían ori-ginalmente, al final de la reacción se obtienen billones demoléculas de la región de DNA de interés a partir decada molécula de DNA original (235 = 3.4 x 1 010copias al final de la PCR). El hecho de que la DNA poli-merasa sintetice sólo la región flanqueada por los ceba-dores permite obtener fragmentos muy específicos y ais-lados del resto del genoma y que son de interés para eldiagnóstico molecular.

La técnica de PCR es sencilla y requiere poco tiempopara su realización. Para llevarla al cabo es necesarioconocer la secuencia del fragmento de DNA que se pla-nea amplificar, situación que ya no es una limitante gra-cias a la finalización del Proyecto del Genoma Humano;así, de acuerdo a ello, se pueden diseñar los cebadoresmás idóneos a través de diversos programas de cómputodisponibles en línea (GeneFisher: http://bibiserv.tech-fak.uni-bielefeld.de/genefisher2/ o PrimerBLAST:http://bibiserv.techfak.uni-bielefeld.de/genefisher2/). Acontinuación se describen los fundamentos de tres técni-cas basadas en PCR para identificación de mutacionesresponsables de enfermedad y un ejemplo de su aplica-ción en el abordaje diagnóstico de una entidad monogé-nica. ©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

36 Genetica clínica

Page 37: Cap 2_Bases Moleculares de La Herencia_Castillo

Determinación de polimorfismos en lalongitud de los fragmentos de restricción(RFLP) por PCR y ensayo de restricción(PCR-RFLP)La determinación de polimorfismos en la longitud de losfragmentos de restricción, RFLP (restriction fragmentlenght polymorphism) por PCR y ensayo de restricción, esuna de las técnicas más sencillas para el reconocimientode mutaciones puntuales, deleciones o insercionespequeñas previamente identificadas en una secuencia deDNA. Esta técnica utiliza a las endonucleasas de restric-ción de origen bacteriano, las cuales tienen la capacidadde escindir un enlace fosfodiéster en cada cadena de unamolécula de DNA de doble cadena al reconocer unasecuencia palindrómica específica de entre 6 a 8 nucleó-tidos de longitud. Existe una gran variedad de enzimasde restricción y cada una reconoce una secuencia blancoespecífica para generar el corte, el sitio de restricciónpuede estar presente o ausente en la secuencia de DNAnormal o bien generarse o perderse por la presencia deuna mutación, lo que determina la presencia de losRFLP. Para la implementación de esta técnica es necesa-ria la selección de la enzima a utilizar y para lo cual, lamutación conocida debe caer en un sitio de restricción oel ensayo puede generar o eliminar uno en el alelo muta-do usando cebadores específicos. Es importante conocerel patrón de restricción o corte presente en la secuenciao alelo normal de DNA, así como en la secuencia o alelomutado a estudiar para la interpretación de los RFLPresultantes al digerir los productos de PCR con la endo-nucleasa seleccionada. El ejemplo de enfermedad quepodría diagnosticarse certeramente a través de la técnicade PCR-RFLP, sería una forma sindromática de craneosi-nostosis coronal autosómica dominante o síndrome deMuenke (MIM #602849) condicionada en 100% de loscasos por un estado heterocigoto para la mutación pun-

tual c.749C > G de sentido erróneo (p.Pro250Arg) queocurre en el gen FGFR3 (4p16.3) (figura A3-2).

SecuenciaciónLa secuenciación de DNA es el método que permiteconocer el orden preciso que guardan los nucleótidos enuna secuencia específica de DNA. Para la detección demutaciones es importante identificar cambios en lasecuencia de estos nucleótidos con respecto a unasecuencia de referencia de esa región o gen específico ypoder determinar si esos cambios son responsables deuna alteración en la proteína que explique la patología.Han existido diferentes métodos para obtener la secuen-cia nucleotídica de una región genómica y en la actuali-dad existen metodologías con capacidad para obtenersecuencias de millones de nucleótidos en una sola reac-ción. Sin embargo, la técnica desarrollada por Sanger ensu versión automatizada es considerada como el estándarde referencia para definir un cambio a nivel de DNA ypor ende para el diagnóstico certero de múltiples trastor-nos mendelianos que se caracterizan por una heteroge-neidad alélica amplia donde predominan las mutacionespuntuales, o pequeñas inserciones/deleciones, tal y comoocurre en los síndromes de cáncer de mama y ovariofamiliar ligados a los genes BRCA1 y BRCA2, la esclero-sis tuberosa, la poliquistosis renal del adulto, la hiperco-lesterolemia familiar, neurofibromatosis tipo I, hemofi-lias tipos A y B, los síndromes de Marfan, Wiskott-Aldrich, CHARGE, Fabry, Hunter, entre otros.

El método de secuenciación tipo Sanger se basa en lainterrupción de la síntesis de una nueva cadena de DNApor métodos químicos utilizando como molde una cade-na sencilla de la región de la cual se desea obtener lasecuencia. En un principio está técnica era laboriosa,empleaba isótopos radioactivos y su resolución era limi-tada a secuencias cortas de DNA, aunque en la actuali-©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Bases moleculares de la herencia 37

Figura A3-1. Etapas de la PCR. Cada ciclo está compuesto por tres temperaturas llamadas de desnaturalización, alineación y extensión. Latemperatura de desnaturalización (95°C) permite que el DNA de doble cadena se separe en dos cadenas sencillas de DNA (desnaturalización).La temperatura de alineación permite la unión de los cebadores a sus cadenas complementarias, formando así regiones de DNA de doble cade-na con un extremo 3’ libre. La temperatura de alineación es variable y está determinada por la secuencia de los cebadores. La temperatura deextensión (72°C) es en donde se lleva a cabo la síntesis de las nuevas cadenas de DNA por una DNA polimerasa. En la actualidad se utilizanDNA polimerasas termoestables, como la Taq DNA polimerasa que es obtenida del microorganismo termofílico Thermus aquaticus, las cualessoportan varios ciclos con temperaturas >90º C sin perder ostensiblemente su actividad catalítica.

5´ 5´

3´ 3´

3´ 3´

Desnaturalización 94° C

Alineación 52-63° C

Primer cicloSegundo ciclo

Extensión 72°C

Page 38: Cap 2_Bases Moleculares de La Herencia_Castillo

dad la técnica se ha podido automatizar gracias al uso deequipos conocidos como secuenciadores capilares y a laincorporación de cuatro distintos fluorocromos en losdideoxinucleótidos A, C, G, T para la identificación ine-quívoca de las bases nitrogenadas que conforman lasecuencia de un fragmento de DNA. El principio de lareacción de secuenciación automatizada tipo Sanger seilustra en la figura A3-3.

La secuenciación automatizada se considera el estudiodiagnóstico de primera línea en el síndrome de Rett(MIM #312750), un trastorno del neurodesarrollo domi-nante ligado al cromosoma X que se considera la segun-da causa genética más frecuente de retraso mental enmujeres y cuya prevalencia se estima en uno afectada en8 a 10 mil mujeres de 15 años de edad. Las pacientescursan con una pérdida progresiva de las habilidadesmotoras y del lenguaje, presencia de conductas estereoti-padas como movimientos anormales y repetitivos enmanos, crisis convulsivas, detención del crecimiento y delperímetro cefálico. La supervivencia de las pacientes seve comprometida (< 40 a 30 años) por trastornos cardio-rrespiratorios, nutricionales, entre otros. Aunque existencriterios diagnósticos de tipo clínico y delaboratorio/gabinete para el síndrome de Rett, la identi-ficación de una mutación en el gen MECP2 por estudiomolecular, es la única manera de establecer de forma ine-quívoca el diagnóstico de esta entidad, en especial enpacientes con las formas atípicas, en donde sólo ~ 40%

presenta mutaciones patogénicas en el gen MECP2. El80% de las mutaciones responsables de los casos con laforma clásica del síndrome se logran identificar a travésdel estudio de secuenciación automatizada de los exones2, 3 y 4 del gen MECP2 (Xq28) (figura A3-4), aunqueen realidad en el exón 3 y 4 es donde ocurren > 95% delas mutaciones responsables de las formas clásicas y atí-picas.

El estudio por secuenciación automatizada de variospacientes, de genes grandes multiexónicos o ambos,genera una gran cantidad de datos, que requieren anali-zarse a través de programas bioinformáticos (p. ej.,BLAST, http://blast.ncbi.nlm.nih.gov/Blast.cgi) quecomparen las secuencias obtenidas del paciente con lassecuencias génicas de referencia, aunque otros progra-mas de cómputo más sofisticados pueden identificar deinmediato todas las variantes patológicas y no patológi-cas (polimorfismos) identificadas en un estudio desecuenciación a gran escala, a través de conectarse auto-máticamente a las bases de datos disponibles en líneacomo dbSNP (http://www.ncbi.nlm.nih.gov/projects/SNP/index.html) o de mutaciones (The Human GeneMutation Database, http://www.hgmd.cf.ac.uk/ac/index.php), con ello se facilita y se optimiza la obtencióny certeza de los resultados.

Por otro lado, la automatización del procedimiento desecuenciación de DNA ha permitido que un genotipopatogénico pueda ser identificado en pocas horas, en ©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

38 Genetica clínica

Figura A3-2. Identificación del genotipo heterocigoto para la muta-ción c.749C>G (p.Pro250Arg) del gen FGFR3 mediante PCR-RFLPen un caso familiar de síndrome de Muenke con expresividad varia-ble y falta de penetrancia. El caso índice (II-2) acudió por craneosi-nostosis bicoronal; su hermano (II-1) es tratado por hidrocefalia, perono presenta craneosinostosis y II-3 se refería sana. Ambos padres notenían antecedentes de craneosinostosis en ellos, ni en otros familia-res. Así, ante la ausencia de antecedentes familiares de craneosinos-tosis, se indico el estudio molecular para distinguir entre una formaesporádica de craneosinostosis coronal (~85% de los casos) o laforma autosómica dominante del síndrome de Muenke. El diagnósti-co molecular de este último, puede establecerse mediante la amplifi-cación por PCR de un fragmento de 337 pares de bases (pb), queincluye al exón 7 (191 pb) y 196 pb del intrón adyacente del genFGFR3. El producto de la PCR se restringe con la endonucleasa NciIpara su posterior análisis por electroforesis en un gel de agarosa. Losalelos normales presentan un único sitio de corte, lo cual da lugar aun fragmento de 214 pb y otro de 123 pb (carril NL), mientras que lapresencia en estado heterocigoto de la mutación p.Pro250Arg(c.749C>G) crea un segundo sitio de restricción, dando lugar a unfragmento adicional de 151 pb presente en el control positivo para lamutación en estado heterocigoto [carril (+)]. Nótese que I-2 es hete-rocigota para la mutación y ésta la heredó a sus tres hijos, sin embar-go en II-3 no se lograron documentar dismorfias u otras alteracionesneurológicas, esqueléticas o auditivas compatibles con el síndrome,excepto por braquidactilia a expensas de falanges medias cortas. Entanto, en I-2, II-1 y II-2 sí se aprecian dismorfias descritas en este sín-drome, tales como hipertelorismo, fisuras palpebrales dirigidas haciaabajo, ptosis palpebral y asimetría facial. Las dismorfias faciales enI-2, II-1 y II-2, la hidrocefalia (poco frecuente en este síndrome) yausencia de craneosinostosis en II-1 y I-2, se explican por la expre-sividad variable descrita en esta entidad. El resultado es de sumaimportancia para el asesoramiento genético de esta familia, ya que adiferencia de la mayoría de los casos con craneosinostosis corona-les esporádicas, los afectados de esta forma autosómica dominante,tienen un riesgo del 50% de transmitir el padecimiento a su descen-dencia, independiente del sexo. Carril MPM: Marcador de pesosmoleculares, escalera de 100 pares de bases (pb).

I

II

1

1 2

2

3

MPM 1-2 II-1 II-2 II-3 I-1 (+) NL

300 pb

200 pb

100 pb

214 pb151 pb123 pb

Page 39: Cap 2_Bases Moleculares de La Herencia_Castillo

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.Bases moleculares de la herencia 39

Figura A3-3. A) Secuenciación de DNA por el método de Sanger automatizado. Generalmente el fragmento a secuenciar es un producto dePCR de hasta 1 kilobase (1,000 pares de bases) de la región de interés. Este producto de PCR es desnaturalizado y en la presencia de uncebador comienza la síntesis de una nueva cadena de DNA por acción de una DNA polimerasa. En la reacción de secuenciación se incluyendesoxinucleósidos trifosfato (dNTP) de cada una de las bases nitrogenadas (adenina, citosina, guanina y timina) así como una proporciónmenor de didesoxinucleósidos trifosfato (ddNTP) de cada una de las bases nitrogenadas, cada uno de ellos marcados con un fluoróforo dis-tinto para cada bases nitrogenadas A, C, T y G. La adición aleatoria de un didesoxinucleótido en las cadenas en crecimiento interrumpe la sín-tesis, dado que esta molécula no cuenta con el grupo hidroxilo en el carbono 3’ de la pentosa, ello hace imposible la generación de un nuevoenlace fosfodiéster con otro dNTP o ddNTP. Lo anterior condiciona en cada reacción la generación de varias cadenas nucleotídicas de dife-rentes longitudes las cuales van marcadas en su extremo 3’ con ddNTP que porta sólo un fluorocromo distintivo para la última base de la cade-na. B) Las cadenas sintetizadas, al tener diferentes tamaños, pueden ser separadas por electroforesis capilar de alta resolución y detectadascon un equipo óptico que determina el fluoróforo presente al final de cada una de las cadenas interrumpidas. Dado que la cadena de tamañomás pequeño viaja más rápido por el capilar, será la primera en ser detectada y al reconocerse el fluoróforo presente al final de esta cadenase puede establecer el nucleótido en el cual se interrumpió su síntesis, la siguiente cadena que pase por el detector será aquella que tiene untamaño en longitud mayor por un nucleótido más y nuevamente al detectar el fluoróforo presente al final, se puede determinar el nucleótido enel que fue interrumpida y así sucesivamente, al establecer en cada cadena sintetizada el nucleótido en el cual fue interrumpida su síntesis sepuede obtener la secuencia de nucleótidos del fragmento original de DNA. Un programa en una computadora acoplada al secuenciador repor-ta el orden de las bases en un electroferograma.

DNA molde de cadena sencilla

Se realizan 4 reacciones diferentes. En cada reacción de sintesis se incluye en bajaproporción sólo uno de los didesoxinucleótidostrifosfato de A, G, C y T marcados con fluoróforos diferentes.

5´GACCATTGGCAG5´

5´3´

+12 +1

Síntesis de DNA Cebador

TGCA

ddTTPddGTP

ddCTPddATP

Aleatoriamente las hebras soninterrumpidas por la incorporación de un ddNTP.

C

C

C

A

A

G

T C

TC

GTC

CGTC

CCGTC

ACCGTC

Tamaño del DNA sintetizado

Cebador+1

Cebador+2

Cebador+3

Cebador+4

Cebador+5

Cebador+6

Cebador+7

Muestra y Buffer

Laser

Buffer

+

Detector defluorescencia

-

Computadora

C CC CCC CCCCT T T TTG GG G GGAA A

Page 40: Cap 2_Bases Moleculares de La Herencia_Castillo

especial cuando la mutación se ha caracterizado antes enuna familia, individuo afectado o portador, lo cual per-mite su aplicación al diagnóstico prenatal molecular deentidades mendelianas, tal y como se ilustra con un casofamiliar de la mucopolisacaridosis tipo II o síndrome deHunter (figura A3-5).

Es importante mencionar que la secuenciación auto-matizada tipo Sanger no es capaz de identificar estadosheterocigotos para deleciones y duplicaciones muy gran-des (del orden de kilobases o megabases), como ocurreen ~ 8% de los casos con síndrome de Rett clásico quetienen deleción completa del gen MECP2 y en > 95% de ©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

40 Genetica clínica

Figura A3-4. Diagnóstico del síndrome de Rett por secuenciación automatizada del gen MECP2. Se ilustra el hábito exterior de una pacientecon síndrome de Rett clásico en fase pseudoestacionaria, donde destaca la presencia de movimientos estereotipados de manos. El electrofe-rograma muestra una porción de las hebras sentido (5´- 3´) de la secuencia codificante del exón 4 del gen MECP2 y la flecha señala un esta-do heterocigoto para la mutación sin sentido c.502C>T, dado que a nivel de proteína cambia al codon 168 de arginina (CGA) por un codon deparo prematuro (TGA). La “N” significa que en esa posición existe una base mixta o empalmada, donde el pico azul representa la citosina delalelo normal y el pico rojo, la timina del alelo mutante. Esta mutación se corrobora en las hebras complementarias o antisentido (estado hete-rocigoto “N” A/G). Más del 99.5% de los casos con síndrome de Rett se originan por mutaciones de novo en la espermatogénesis y la mayo-ría de éstas consisten en transiciones C>T atribuibles a desaminación espontánea de citosinas metiladas en dinucleótidos CpG; en este caso,nótese que la base siguiente a la mutación en la hebra sentido es precisamente una guanina.

5´ Hebra sentido

A A A A A A AG G G G G G G

180 190

C C C C C C C C C CNT

170

5´ Hebra complementaria

G G G G G G G G G G220 230 240

T T T T T T TC C C C C CAN

}CGA: ARG (alelo normal)TGA: Stop (alelo mutado)

Page 41: Cap 2_Bases Moleculares de La Herencia_Castillo

los casos con neuropatía periférica Charcot-Marie Toothtipo 1A que presentan una duplicación de todo el genPMP22. Por ello es importante conocer el espectro demutaciones descritas en el trastorno mendeliano a diag-nosticar en el paciente y reconocer esta limitante de latécnica cuando se interpretan los resultados y así evitarla asignación de un genotipo erróneo y un asesoramien-to genético inadecuado. En enfermedades monogénicasen donde predominan deleciones o duplicaciones gran-des se deben utilizar otras metodologías molecularescomo la MLPA, misma que a continuación se describe.

Amplificación múltiple dependiente de lahibridación de sondas (MLPA, multiplexligation-dependent probe amplification)La amplificación múltiple dependiente de la ligación desondas o MLPA es una variante de la PCR en la cual sepueden amplificar diferentes fragmentos de DNA enuna misma reacción utilizando un solo par de cebadoresy bajo las mismas condiciones de ciclos de temperatura.Por esta técnica se pueden amplificar regiones génicascercanas o adyacentes con la finalidad de determinar concerteza la dosis génica en muestras de DNA de pacientesafectados de deleciones o duplicaciones grandes en esta-

do heterocigoto, homocigoto o hemicigoto. En el ensayose pueden utilizar como controles muestras de DNA condeleciones o duplicaciones génicas grandes previamentecaracterizadas y las cuales pueden involucrar desde unexón a varios de ellos o incluso loci aledaños. La capaci-dad de amplificar varias sondas en la misma reacción,permite delimitar con mayor precisión los puntos derotura y reunión de las deleciones o duplicaciones, asícomo la extensión de dichos rearreglos.

La MLPA permite el análisis mediante electroforesiscapilar de hasta 45 sondas diferentes amplificadas en unasola reacción. Cada secuencia del DNA blanco (p. ej., unexón) es reconocida por una sonda conformada por dosmitades, denominadas sonda 5’ y sonda 3’. Si existe unacomplementaridad de las dos sondas con la muestra deDNA templado, se forma un enlace fosfodiéster entreambas mediante la acción de una ligasa. Los extremos deambas sondas poseen una secuencia artificialmente dise-ñada que es complementaria a un solo par de oligonucle-ótidos o cebadores universales que permiten su amplifi-cación por PCR, siempre y cuando las sondas 5’ y 3’ sehayan ligado. Los cebadores universales permitirán laamplificación de todas las sondas bajo las mismas condi-ciones; los ensayos más recientes, incluyen un cebadoruniversal marcado con una molécula fluorescente en el©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

Bases moleculares de la herencia 41

Figura A3-5. Diagnóstico prenatal molecular del síndrome de Hunter a través de secuenciación automatizada dirigida del exón 7 del gen IDS(Xq28). Esta entidad se hereda con u patrón recesivo ligado al cromosoma X, donde se estima que el 80% de las madres de casos únicoscomo es el presente caso, son portadoras o heterocigotas asintomáticas para el rasgo. El caso índice cuenta con el diagnóstico clínico, enzi-mático y molecular del síndrome de Hunter. La identificación de la mutación responsable del padecimiento en II-1 se llevo al cabo mediante laamplificación por PCR y subsecuente secuenciación de los 9 exones que comprenden la secuencia codificante del gen IDS. La comparacióndel electroferograma parcial del exón 7 de II-1 con la secuencia normal revela un genotipo hemicigoto para la mutación c.1003C>T del gen IDS(flechas). Posteriormente se hizo la búsqueda dirigida de esta mutación en I-1 mediante PCR y secuenciación de sólo el exón 7, ya que esaquí donde se ubica la mutación responsable. El electroferograma del exón 7 en I-1 reveló un estado heterocigoto (portador) para la mutaciónpresente en su hijo. La madre posterior a asesoramiento genético solicita diagnóstico prenatal. El cariotipo obtenido a partir de cultivo de amnio-citos se reportó con una fórmula 46,XY y debido a ello se procedió inmediatamente a la secuenciación directa del exón 7 a partir de una mues-tra de DNA obtenido de los amniocitos en cultivo. El electroferograma del producto de la gestación revela que éste heredó el mismo genotipoIDS que su hermano afectado. Adicionalmente el genotipo alterado se corroboró en la hebra antisentido del mismo exón (dato no mostrado).Cabe mencionar que el tiempo requerido para el estudio prenatal molecular requirió de sólo dos días. El mismo procedimiento puede hacerseen células amnióticas o muestras de vellosidades coriales sin cultivo, aunque con este material biológico se reporta un riesgo ligeramente incre-mentado para que el ensayo molecular se contamine con DNA genómico de origen materno.

Secuencia normal

Hemicigoto c.1003C>T(p.His335Tyr)

Heterocigota c.1003C>T(p.His335Tyr)

Hemicigoto c.1003C>T(p.His335Tyr)

II-1

I-1

II-2

I

II

1

21

20 SDG

C C C C C CA A A A A AT T T T T T TG G G G G170 180

His335

c.1003

}Tyr

C C C C CA A A A A AT T T T T T TG G G G GT170 180

170 180

170 180

A T T T A C C T C G G A T A T G G T A A G CN

A T T T A C C T C G G A T A T G G T A A G CT

}

Page 42: Cap 2_Bases Moleculares de La Herencia_Castillo

extremo 5’ el cual permite la detección de los amplico-nes de las sondas a través de análisis de fragmentos porelectroforesis capilar en un equipo de secuenciaciónautomatizada. La distinción entre las diferentes sondasligadas y amplificadas correspondientes a cada una de lasregiones blanco del DNA templado, se basa en el tama-ño en pares de bases de cada sonda ligada y amplificada.Lo anterior, se logra al añadir, en el extremo 3’, unasecuencia artificial o stuffer cuya longitud varía para cadasonda. Así, cada sonda específica de un exón o regióngénica tendrá un tamaño específico y será fácilmente

identificable mediante análisis electroforético. En la figu-ra A3-6 se esquematiza el fundamento del MLPA.

La técnica de MLPA puede ser complementaria alestudio de secuenciación para incrementar la certezadiagnóstica en algunas entidades mendelianas, como porejemplo el síndrome de Rett, ya que la secuenciaciónautomatizada y el estudio de MLPA identifican el geno-tipo responsable en casi 90% de las pacientes con las for-mas clásicas. En poblaciones distintas a las de origenAskenazi o del norte de Europa, la secuenciación auto-matizada del gen CFTR identifica cerca de 99% de las ©

Edi

toria

l El m

anua

l mod

erno

Foto

copi

ar s

in a

utor

izac

ión

es u

n de

lito.

42 Genetica clínica

Figura A3-6. Fundamento MLPA. A) Las dos mitades de una sonda 5’ y 3’, contiene una secuencia nucleotídica para hibridar o unirse con elDNA en estudio del paciente y una secuencia específica para un par de cebadores universales (primers X y Y). B) Las sondas 5´y 3´en pre-sencia del DNA desnaturalizado del paciente, se unen a éste por complementariedad. C) Si la secuencia de reconocimiento está presente enel DNA del paciente las sondas 5´y 3´ quedan adyacentes y pueden ser unidas por la acción de una enzima ligasa, formando una sonda única.Esto sucede con cada par de sondas que están incluidas en el ensayo. D) Las sondas ligadas son amplificadas por PCR con el uso de un parde cebadores universales. La distinción entre las diferentes sondas ligadas y amplificadas se establece a partir de las diferencias en el tama-ño de la secuencia “stuffer” de cada sonda. E) Los productos obtenidos por PCR son analizados por electroforesis capilar y se comparan conun control normal para determinar si existen deleciones o duplicaciones en estado heterocigoto en el DNA del paciente.

Secuencia de unión para primer X Mitad 5´sonda A

Sonda 1Mitad 3´sonda A

secuencia dereconocimiento izquierda

Secuencia dereconocimiento derecha

Secuencia de unión para primer Y

Alineación de mitad 5´y 3´de la sonda A Alineación de mitad 5´y 3´de la sonda B

DNA paciente

UniónUnión

DNA pacienteAmplificación por PCR múltiple con un solo juego de cebadores

Primer X Primer Y

Análisis de fragmentos en electroforésis capilar

3 300-2 200-1 100- 0-Locus

Inte

sity

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Sondas MLPA

Secuencia “Stuffer” (60 a 450 pb)

1

2

3

n

DNA genómicodesnaturalizado

Secuencias que brindan a las partes adyacentes del gen

Secuencias complementarias a los primeros universales

Secuencia tipo “Stuffer”

Hibrida-ción Ligación PCR

Análisis por electroforesis capilar

Duplicación

Dosis normal

Page 43: Cap 2_Bases Moleculares de La Herencia_Castillo

mutaciones responsables, pero quizá < 1% de alelosmutados CFTR corresponden a deleciones grandes quepueden ser identificadas por MLPA. Las deleciones deuno o más exones en el gen BRCA1 se encuentran pre-sentes hasta en 20 a 30% de los casos de síndrome decáncer de mama y ovario familiar de origen holandés.Este tipo de mutación pasa inadvertido en el estudio deprimera línea, que es la secuenciación automatizada, porlo que en pacientes con un resultado negativo, con datosclínicos y genealógicos altamente sugestivos de este sín-drome de cáncer familiar, está indicado el estudio deMLPA. Por último, la identificación de mujeres portado-ras o heterocigotas para deleciones de uno o más exonesen el gen DMD responsables de 40 a 60% de los casoscon distrofinopatías, pueden llegar a documentarse demanera certera con MLPA, y de igual forma, las duplica-ciones de uno o más exones de este gen y responsablesde 6 a 8% de los casos con distrofinopatía, pueden iden-tificarse por la misma técnica tanto en casos masculinosafectados como en mujeres portadoras.

BIBLIOGRAFÍA

Alcántara OMA, González AA, Barrientos RR et al.: Screeningof late-onset Pompe disease in a sample of Mexicanpatients with myopathies of unknown etiology: identifica-tion of a novel mutation in the acid alpha-glucosidasegene. J Child Neurol 2010;25:1034-1037.

Boyadjiev SA: International Craniosynostosis Consortium.Genetic analysis of non-syndromic craniosynostosis.Orthod Craniofac Res 2007;10:129-137.

Innis M, Gelfand D: Optimization of PCR’s. En: Innis M,Gelfand D, Snitsky J, White T. eds. PCR Protocols: a guideto methods and applications, 1st ed. Academic Press, SanDiego, USA 1990:3-12.

Jorde L, Carey J, Bamshad M, White R: Genetic variation: itsorigin and detection. En: Jorde L, Carey J, Bamshad M,White R. eds. Medical Genetics, 3rd ed. Mosby, St. Louis,USA 2003:29-106.

Kozlowski P, Jasinska AJ, Kwiatkowski DJ: New applicationsand developments in the use of multiplex ligation-depen-dent probe amplification. Electrophoresis 2008;29:4627-4636.

Rodríguez Sánchez I; Barrera SH: La reacción en cadena de lapolimerasa a dos décadas de su invención. Ciencia UANL2004;7(3):323-335.

Rose EA: Applications of PCR to Genome Analysis. FASEB J1991;5:46-54.

Strachan T, Read A: Amplifying DNA: PCR and cell based clo-ning En: Strachan T, Read A. eds. Human MolecularGenetics 3. Garland Science, New York, USA 2004:122-154, 182-203.

Watson J, Caudy A, Myers R, Witkowski J: Basic tools ofrecombinant DNA. En: Watson J, Caudy A, Myers R,Witkowski J. eds. Recombinant DNA Genes andGenomes- A short course 3rd ed. Cold Spring HarborPress, New York, USA 2007:75-106.

Zurflüh MR, Zschocke J, Lindner M, Feillet F et al.: Moleculargenetics of tetrahydrobiopterin-responsive phenylalaninehydroxylase deficiency. Hum Mutat 2008;29:167-175.

RECURSOS EN LA RED

OMIM ® - Online Mendelian Inheritance in Man ®http://www.ncbi.nlm.nih.gov/omim

Gene Reviewshttp://www.ncbi.nlm.nih.gov/books/NBK1116/

Molecular Genetics and Metabolism Laboratory (2011)http://metabolic-genetic-disease.gmxhome.de/

© E

dito

rial E

l man

ual m

oder

noFo

toco

piar

sin

aut

oriz

ació

n es

un

delit

o.Bases moleculares de la herencia 43

Page 44: Cap 2_Bases Moleculares de La Herencia_Castillo