SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez...

88
SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL TRANSCRIPTOMA DE CÉLULAS DE NEUROBLASTOMA HUMANO SH-SY5Y TRATADAS CON ÁCIDO RETINOICO Máster en Biotecnología Biomédica Trabajo fin de máster Valencia, Marzo de 2014 Realizado por: Zara Sáez García Directores: Domingo Barettino Fraile / Pascual Sanz Bigorra Tutora UPV: Lynne Yenush

Transcript of SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez...

Page 1: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

SECUENCIACIÓN

POR RNA-Seq Y ANÁLISIS DEL

TRANSCRIPTOMA DE CÉLULAS

DE NEUROBLASTOMA

HUMANO SH-SY5Y TRATADAS

CON ÁCIDO RETINOICO

Máster en Biotecnología Biomédica

Trabajo fin de máster

Valencia, Marzo de 2014

Realizado por: Zara Sáez García

Directores: Domingo Barettino Fraile /

Pascual Sanz Bigorra

Tutora UPV: Lynne Yenush

Page 2: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 3: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

A Domingo Barettino,

gran científico y mejor persona

Page 4: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 5: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

AGRADECIMIENTOS

En primer lugar, quiero dar las gracias al Dr. Domingo Barettino Fraile, mi director del

trabajo de fin de máster, al haberme dado la oportunidad de realizar este trabajo en su

laboratorio, por las cosas aprendidas a su lado y los consejos dados durante mi estancia

en el IBV.

Tras su ausencia, tengo muchas cosas que agradecer a muchas personas.

A Susana y Elena por toda la ayuda recibida en el laboratorio, por los buenos momentos

pasados en el mismo, por los buenos consejos tanto a nivel experimental como a nivel

personal, y por haberme guiado en el desarrollo de este trabajo; a Salva por haberme

ayudado a ordenar mis ideas en ausencia de Domingo; y a los tres por aportarme una

visión de cómo le hubiera gustado que se hubiera llevado a cabo este trabajo.

A Jordi por haberme ayudado y guiado en el proceso de la secuenciación, a Ana y Sonia

por haber tenido la paciencia de ayudarme con los análisis bioinformáticos, así como de

la interpretación de los resultados y sus consejos.

A Lynne, mi tutora de la UPV; y a Pascual, mi director del trabajo fin de máster tras la

ausencia de Domingo; por sus consejos y su ayuda durante la redacción de este trabajo.

A Julián, por haberme apoyado en todo momento y estar a mi lado en los momentos en

que más lo he necesitado. Eres muy grande. Te quiero.

A todos, GRACIAS, porque sin ellos no habría sido posible la realización de este

trabajo.

Page 6: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 7: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

ÍNDICES

Page 8: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 9: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Índices

iii

ÍNDICE GENERAL 1. INTRODUCCIÓN .......................................................................................................... 1

1.1 La vitamina A. Metabolismo y mecanismo de acción. ............................................ 3

1.2 Regulación génica del RA. Mecanismo clásico

de acción del RA. ........................................................................................................ 5

1.3 Regulación extra-genómica. Mecanismo de acción

no transcripcional del RA. ........................................................................................ 6

1.4 El RA en la diferenciación neuronal: Neuroblastoma .............................................. 6

2. OBJETIVOS .................................................................................................................... 9

3. MATERIAL Y MÉTODOS......................................................................................... 13

3.1 Cultivos celulares y tratamientos ............................................................................. 15

3.2 Extracción del RNA .................................................................................................. 15

3.3 Electroforesis............................................................................................................. 15

3.4 Purificación del RNA ............................................................................................... 16

3.5 Retrotranscripción (RT) de miR-10a/10b................................................................ 16

3.6 Real-Time PCR ......................................................................................................... 16

3.7 Secuenciación del transcriptoma: RNA-Seq ........................................................... 18

3.8 Obtención y mapeado de las secuencias.................................................................. 23

3.9 Análisis de las secuencias: Qualimap Y NOISeq ................................................... 23

3.9.1 Qualimap....................................................................................................... 23

3.9.2 NOISeq .......................................................................................................... 24

3.9.3 Análisis de enriquecimiento de términos

Gene Ontology (GO) .................................................................................... 25

4. RESULTADOS Y DISCUSIÓN ................................................................................. 27

4.1 Electroforesis del RNA total y detección

de contaminaciones................................................................................................ 29

4.2 Purificación de RNA................................................................................................. 29

4.3 Retrotranscripción y RT-PCR de miR-10a y miR-10b .......................................... 30

4.4 Análisis de las secuencias......................................................................................... 30

4.4.1 Biodetección ..................................................................................................... 31

4.4.2 Counts por biotipo ............................................................................................ 32

4.4.3 Contenido en GC .............................................................................................. 33

4.4.4 Length bias ........................................................................................................ 33

4.4.5 Profundidad de secuenciación ......................................................................... 38

4.4.6 Distribución de los counts en cada muestra

y normalización ......................................................................................................... 39

4.4.7 Análisis de componentes principales (PCA) .................................................. 40

4.5 Expresión diferencial ................................................................................................ 42

4.6 Análisis de enriquecimiento de términos GO ......................................................... 51

4.6.1 Procesos infrarregulados durante

24 horas de tratamiento con RA ....................................................................... 51

4.6.2 Procesos sobrerregulados durante

24 horas de tratamiento con RA ...................................................................... 52

4.6.3 Procesos sobrerregulados comunes

durante 24 y 48 horas de tratamiento con RA ................................................. 52

4.6.4 Procesos sobrerregulados durante

48 horas de tratamiento con RA ........................................................................ 54

5. CONCLUSIONES......................................................................................................... 63

6. FUTURAS PERSPECTIVAS ..................................................................................... 67

7. BIBLIOGRAFÍA ........................................................................................................... 71

Page 10: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Índices

iv

ÍNDICE DE FIGURAS

INTRODUCCIÓN

Figura 1. Ingesta y metabolismo de retinoides de la dieta y carotenoides proretinoicos

dentro de intestino. ................................................................................................................ 3 Figura 2. Transporte de los compuestos derivados del metabolismo de carotenoides y

retinoides. ...................................................................................................................... 4

Figura 3. Metabolismo del RA... ......................................................................................... 4 Figura 4. Ruta de señalización de RA................................................................................. 5 Figura 5. Modelo propuesto de activación de la PI3K inducida por RA.......................... 6

Figura 6. Diferenciación neuronal inducida por RA en células SH-SY5Y de

neuroblastoma humano ................................................................................................. 7

MATERIAL Y MÉTODOS

Figura 7. Cuantificación relativa en RT-PCR .................................................................. 18 Figura 8. Selección de los fragmentos de RNA de 150-200 pb mediante el Agilent

Bioanalyzer 2100. ....................................................................................................... 19 Figura 9. Esquema general del protocolo SOLiD® Total RNA-Seq Kit .......................... 20 Figura 10. PCR en emulsión y enriquecimiento de las beads ......................................... 21

Figura 11. Esquema de la secuenciación por ligación. ................................................... 22 Figura 12. Secuenciación en SOLiD por pair-ends ......................................................... 23 Figura 13. Capturas de pantalla Qualimap y el output generado. ................................... 23

RESULTADOS Y DISCUSIÓN

Figura 14. Electroforesis del RNA total. .......................................................................... 29

Figura 15. Electroforesis tras purificación con RNeasy Micro Kit y el RiboMinus™

Eukaryote Kit for RNA-Seq ........................................................................................ 29 Figura 16. Gráficas resultantes de la RT-PCR de miR-10a y miR-10b.......................... 30

Figura 17. Biodetección de las muestras control, 24 horas y 48 horas .......................... 31 Figura 18. Counts por biotipo para las condiciones de la réplica 1. ............................... 35 Figura 19. Contenido en GC para las muestras control, 24 y 48 horas. ......................... 36

Figura 20. Length bias de las muestras control, 24 y 48 horas. ...................................... 37 Figura 21. Profundidad de secuenciación. ........................................................................ 38 Figura 22. Distribución de los counts ............................................................................... 39

Figura 23. Loading plots.................................................................................................... 40 Figura 24. Score plots.. ..................................................................................................... 41 Figura 25. Síntesis y degradación de RA ......................................................................... 53

Page 11: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Índices

v

ÍNDICE DE TABLAS

MATERIAL Y MÉTODOS

Tabla 1. Componentes de la reacción de la retrotranscripción de miR-10a/10b ............ 16 Tabla 2. Condiciones de la RT-PCR de miR-10a/10b ..................................................... 16 Tabla 3. Número de muestras y réplicas por cada ensayo de RT-PCR, incluyendo

también los controles negativos. ................................................................................ 17 Tabla 4. Componentes de la reacción de RT-PCR de miR-10a/10b .............................. 18

RESULTADOS Y DISCUSIÓN

Tabla 5. 118 genes sobreexpresados tras 24 horas de tratamiento con RA, respecto al

Control 1 (0 horas). ..................................................................................................... 44 Tabla 6. 32 genes infraexpresados tras 24 horas de tratamiento con RA, respecto al

Control 1 (0 horas). ..................................................................................................... 47

Tabla 7. 93 genes infraexpresados tras 48 horas de tratamiento con RA, respecto al

Control 1 (0 horas). ..................................................................................................... 48 Tabla 8. 23 genes infraexpresados tras 48 horas de tratamiento con RA, respecto al

Control 1 (0 horas). ..................................................................................................... 50 Tabla 9. Clasificación en categorías GO de los genes sobreexpresados tras 24 horas de

tratamiento con RA. .................................................................................................... 55

Tabla 10. Clasificación en categorías GO de los genes infraexpresados tras 24 horas de

tratamiento con RA. .................................................................................................... 58 Tabla 11. Clasificación en catergorías GO de los genes sobreexpresados tras 48 horas

de tratamiento con RA. ............................................................................................... 59

Page 12: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Índices

vi

ABREVIATURAS

RA Retinoic Acid

CYP26A1 Cytochrome P450, family 26, subfamily A, polypeptide 1

CYP26B1 Cytochrome P450, family 26, subfamily B, polypeptide 1

RARB Retinoic acid receptor, beta

miR microRNA

RET Receptor tyrosine kinase

NTRK2 Neurotrophic tyrosine kinase receptor type 2

RDH Retinol dehydrogenase

DHRS Short-chain dehydrogenase

RT-PCR Real-Time PCR

GO Gene Ontology

TMM Trimmed mean of M values

Page 13: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

1. INTRODUCCIÓN

Page 14: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 15: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

3

1.1 La vitamina A. Metabolismo y mecanismo de acción.

El término vitamina A está reservado para designar cualquier compuesto que posea la

actividad biológica del retinol. El Ácido todo-trans Retinoico (all-trans retinoic acid,

RA), originalmente designado como ácido vitamina A, es un producto del metabolismo

oxidativo del retinol y es considerado el derivado de la vitamina A más activo a nivel

fisiológico [1].

Dado que ningún animal puede sintetizar vitamina A, ésta sólo puede ser asimilada a

partir de la dieta, bien como vitamina A preformada o como carotenoides proretinoicos;

y es en los enterocitos donde tiene lugar su metabolismo. Los carotenoides

proretinoicos, como el β-caroteno, son tomados por el enterocito mediante un proceso

que implica al receptor SR-B1 (scavenger receptor class B, type I). Una vez en su

interior, el β-caroteno se procesa por la enzima BCMO1 (β-carotene-15,15’-

monooxygenase) para convertirlo en retinal, que se une a la proteína CRBPII (cellular

retinoid binding protein), o puede ser incorporado intacto y sin modificaciones junto

con la grasa de la dieta y colesterol en quilomicrones. El retinal derivado del β-caroteno

se reduce a retinol, proceso catalizado por una o más retinal reductasas no

caracterizadas aún. Los ésteres de retinol de la dieta pueden ser o bien hidrolizados en el

lumen del intestino por las lipasas PTL (pancreatic triglyceride lipase) o PLRP2

(pancreatic lipase related protein 2), o bien hidrolizados en las células intestinales en

cepillo por la enzima REH (retinyl ester hydrolase). El retinol tomado por los

enterocitos se une a la proteína CRBPII y se esterifica a éster de retinol. Como respuesta

a un cambio fisiológico de retinol, la enzima LRAT (lecitin:retinol acyltransferase)

catalizará aproximadamente en un 90% la formación de los ésteres de retinol, mientras

el resto lo cataliza la enzima intestinal DGAT1 (diacylglycerol acyltransferase 1). Los

ésteres de retinol formados serán empaquetados junto con la grasa de la dieta y

colesterol en quilomicrones, que serán secretados al sistema linfático (figura 1) (para

revisión [2]).

Figura 1. Ingesta y metabolismo de retinoides de la dieta y carotenoides proretinoicos dentro de intestino. Tomado de [2].

Page 16: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

4

El transporte de ésteres de retinol por el sistema linfático desemboca en el hígado. Allí,

los ésteres pasan a retinol, que puede ser transportado por la circulación sanguínea

unido al complejo RBP/TTR (retinol binding proteim/transthyretin) hasta tejidos diana,

como la retina (figura 2) [3].

Figura 2. Transporte de los compuestos derivados del metabolismo de carotenoides y retinoides. Los ésteres de retinol se transportan mediante el sistema linfático al hígado; el retinol se transporta a otros

tejidos diana, como la retina, a través de la circulación sanguínea. Tomado de [4]

El retinol o all-trans-retinol circulante unido a RBP/TTR es tomado por los tejidos

diana, y especialmente por algunos tejidos mediante mediante la proteína

transmembrana STRA6, cuya expresión se induce por RA [5]. Una vez en la célula, el

retinol se oxida a retinaldehido, también llamado all-trans-retinal, mediante las enzimas

alcohol deshidrogenasas (ADHs) y las deshidrogenasas-reductasas de cadena corta

(retinol deshidrogenasas, RDHs); siendo esta oxidación reversible mediante

deshidrogenasas/reductasas DHRS. El retinaldehido se oxida a ácido retinoico o all-

trans-retinoic acid (RA) mediante tres enzimas retinaldehido deshidrogenasas RALDH

(RALDH1, RALDH2 y RALDH3) [6, 7]. El proceso de síntesis de RA se muestra en la

figura 3A.

Figura 3. Metabolismo del RA. (A) Síntesis de RA o all-trans-retinoic acid. (B) Degradación de RA.

Modificado de [8].

DHRS3

B

A

Page 17: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

5

Para que exista una homeostasis adecuada del ácido retinoico, no sólo es necesario que

se sintetice, sino también que se degrade. La ruta de degradación implica a enzimas

tales como los citocromos P450, subfamilia 26 (CYP26A1, CYP26B1 Y CYP26C1);

que catalizan reacciones que convierten el RA en metabolitos más polares, siendo el

primero el 4-hidroxil-RA, que a su vez se oxida a 4-oxo-RA [9]. La importancia de

estos citocromos CYP26 radica en la prevención de una señalización inadecuada en

poblaciones celulares específicas durante el desarrollo embrionario (figura 3B)[10,11].

1.2 Regulación génica del RA. Mecanismo clásico de acción del RA

El RA actúa uniéndose a RARs (receptores de ácido retinoico), que son miembros de

una superfamilia de receptores nucleares: RARα, RARβ y RARγ. Estos RARs actúan en

combinaciones heterodiméricas con receptores X de retinoide RXRs (RXRα, RXRβ y

RXRγ), que se unen al esteroisómero 9-cis-RA que, a diferencia del all-trans-RA, no se

detecta en embriones o tejidos adultos. Los RXRs actúan principalmente como

“andamios” proteicos para facilitar la unión del complejo RAR-RXR al DNA en zonas

con motivos conocidos como RAREs (elementos de unión al RA), que consisten en una

repetición directa en el centro de una secuencia hexamérica 5’-(A/G)G(G/T)TCA-3’ o

con un motivo 5’-(A/G)G(G/T)(G/T)(G/C)A-3’ más relajado separado por 1, 2 o 5 pares

de bases. El complejo RAR/RXR puede unirse a estos RAREs en ausencia de ligando,

por lo que reclutan los complejos inhibidores NCoR (nuclear receptor corepressor) y

SMRT (silencing mediator for retinoid and thyroid receptors) y mantienen la represión

del gen diana. En presencia de ligando, un cambio conformacional conduce a la

liberación de los represores y al reclutamiento de complejos co-activadores, lo que

conduce a una remodelación de la cromatina, descompactándose y facilitando el

ensamblaje de complejos transcripcionales pre-iniciación, que contiene RNA

polimerasa II, proteína de unión a TATA (TBP) y factores asociados a TBP (figura 4);

permitiendo la expresión de genes implicados en la diferenciación.

Entre los genes diana de RAR se incluyen aquellos implicados en la ruta del RA, como

Rarb, Crbp1/2, Rbp1/2, Crabp1/2 y Cyp26a1, además de varios miembros de la familia

génica Hox (Hoxa1, Hoxb1, Hoxb4 y Hoxd4) (para revisión [8]).

Figura 4. Ruta de señalización de RA. El RA, ya sea sintetizado o difundido por células adyacentes, en

ciertas ocasiones llega al núcleo transportado por proteínas de unión al ácido retinoico celular, CRABPs.

Las proteínas de unión al retinol celular (CRBPs) estaría ayudando a presentar el retinol a la retinol

deshidrogenasa RDH. Tomado de [8].

Page 18: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

6

1.3 Regulación extra-genómica. Mecanismo de acción no transcripcional del RA

Mientras que el mecanismo anterior se basa en acciones génomicas que implican

síntesis de RNA y proteínas, el mecanismo del acción no transcripcional implica la

activación inducida por ligando de rutas de transducción de señal, que genera una

respuesta más rápida que el mecanismo anterior.

En estudios anteriores en nuestro laboratorio se describió que el tratamiento de células

de neuroblastoma humano SH-SY5Y con RA conducía a la activación de la ruta

PI3K/AKT, sugiriendo que el RA está implicado en la regulación de la apoptosis y en la

supervivencia celular [12,13]

La regulación de la supervivencia dependiente de PI3K (phosphatidylinositol 3-kinase)

está mediada por la activación de la proteína quinasa AKT [14,15], la cual requiere su

translocación a la membrana plasmática y su fosforilación en treonina 308 (Thr308) y

serina 473 (Ser473) por la quinasa PDK-1 (phosphoinositide-dependent kinase 1) y el

complejo mTOR2, respectivamente [16]. A su vez, la activación de AKT es regulada

negativamente por la fosfatasa PTEN, capaz de revertir la fosforilación de PI3P

realizada por la PI3K [17]. Entre los sustratos de AKT se incluyen la inactivación de

mediadores proapoptóticos (Bad, Bax, caspasa-9, GSK-3, p53, etc) y la activación de

proteínas antiapoptóticas (Bcl2, mTOR, etc)[14,18].

En el laboratorio se describió también que en la activación de la ruta PI3K/AKT

interviene el receptor RAR, el cual forma complejo estable con la subunidad reguladora

de PI3K (p85). Ello conduce a la formación del complejo de señalización de la PI3K por

reclutamiento de la subunidad catalítica p110 a la membrana y por lo tanto a la

activación de la ruta (figura 5)[12].

Figura 5. Modelo propuesto de activación de la PI3K inducida por RA. Tomado de [1].

1.4 El RA en la diferenciación neuronal: Neuroblastoma

El neuroblastoma es el tumor sólido extracraneal más común en la infancia, con una

prevalencia estimada de 11,3 casos cada 100.000 habitantes en Europa, a fecha de

noviembre de 2013 [19]. Este tipo de tumor se origina a partir de células de la cresta

neural que emigran para formar ganglios simpáticos y la médula suprarrenal [20].

El neuroblastoma se puede clasificar en tres grupos dependiendo de si su diagnóstico es

favorable, intermedio o de alto riesgo. El grupo de diagnóstico favorable comprende

niños con neuroblastoma en estadío 1 o 2 de cualquier edad y estadío 4 sin

amplificación del gen N-myc; el grupo de diagnóstico intermedio comprende niños con

Page 19: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

7

neuroblastoma en estadío 3 y 4 de cualquier edad, sin amplificación de N-myc; y el

grupo de alto riesgo está compuesto por niños con estadíos 2, 3 y 4 y con amplificación

de N-myc [20].

Los tratamientos del neuroblastoma incluyen quimioterapia de inducción, transplante

autólogo de progenitores hematopoyéticos, anticuerpos monoclonales y agentes

diferenciadores, como el RA [20, 21].

En el presente trabajo se utilizará el RA como agente diferenciador en células de

neuroblastoma humano SH-SY5Y.

Tal y como se observa en la figura 6, tras el tratamiento con RA en células SH-SY5Y

hay claros signos de diferenciación neural; marcado por el crecimiento de neuritas, la

forma piramidal de las células y el hecho de que no forman clusters [22].

Figura 6. Diferenciación neuronal inducida por RA en células SH-SY5Y de neuroblastoma humano. Tomada de [1].

Recientemente se ha descubierto la importancia de los microRNAs en los procesos

tumorales.

Los microRNAs (miRNAs) son un tipo de RNAs no codificantes pequeños (de 19-22

nucleótidos) implicados en múltiples procesos biológicos que pueden regular la

expresión génica a nivel postranscripcional de una forma coordinada bajo un estímulo o

situación de estrés, uniéndose a las regiones 3’-UTR de ciertos RNAs mensajeros

(mRNAs), y pudiendo además regular varias dianas al mismo tiempo. Estos miRNAs

pueden causar la degradación de mRNAs o inhibir su traducción, y por tanto estar

implicados en el crecimiento y desarrollo. La desregulación de los miRNAs puede tener

efectos oncogénicos o funciones de supresión tumoral en muchas formas de cáncer,

incluyendo en neuroblastoma [23].

Estudios previos realizados en el laboratorio mediante TaqMan MicroRNA arrays

revelan que el RA produce diferenciación neural de células humanas SH-SY5Y de

neuroblastoma mediante la inducción de los microRNAs miR-10a y miR-10b, entre

otros; lo que conduce a la reducción de la agresividad biológica de las células

tumorales, la migración y la invasión. Ello se comprobó mediante el tratamiento de

células SH-SY5Y con RA y posterior transfección de anti-miR-10a y anti-miR-10b;

dando como resultado una incapacidad de diferenciación al tipo neural debido al

bloqueo ambos miRNAs, y por tanto una reducción en los marcadores de diferenciación

[24].

Page 20: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Introducción

8

Además, en estos estudios se ha observado que la mimetización o silenciamiento de los

miRNA-10a y -10b mediante la transfección de pre-miRs-10a y 10b o anti-miRs-10a y

10b, respectivamente, tiene consecuencias con respecto a la expresión marcadores de

diferenciación característicos de células de neuroblastoma SH-SY5Y.

Estos marcadores de diferenciación son los receptores tirosin-quinasa NTRK2 (trkB), el

receptor tirosina quinasa RET (ambos aumentan su expresión con tratamiento de RA);

mRNAs de GAP43 (growth-assciated protein), la enolasa ENO2 (estos dos últimos

disminuyen en aquellas células que se han transfectado con anti-miR-10a o anti-miR-

10b), TH (tyrosine hydroxylase) y NEFM (neurofilament medium polypeptide).

Cuando únicamente se transfectan células con pre-miRs-10a y -10b, se mejoran los

niveles de estos marcadores de diferenciación con respecto al control negativo, pero

están por debajo de los obtenidos con el tratamiento con RA, lo cual sugiere que miR-

10a y -10b parecen ser necesarios pero no suficientes para completar la diferenciación

neural y que son las acciones adicionales de RA lo que contribuye a la diferenciación

completa [23].

Además de los marcadores anteriormente mencionados, se han descrito otros

relacionados con la neurotransmisión adrenérgica, como el transportador de dopamina

(DAT), receptores de dopamina subtipos 2 y 3 (D2R y DR3), transportador vesicular de

monoamina (VMAT) y transportador de norepinefrina (NET); y con la

neurotransmisión colinérgica, como los receptores para la acetilcolina, tanto

muscarínicos acoplados a proteína G como nicotínicos. En ambos casos, estos

marcadores se muestran incrementados por inducción de la diferenciación por RA o por

otros agentes diferenciadores como los ésteres de forbol (TPA) [22].

Una vez diferenciadas, las células SH-SY5Y expresan marcadores neuronales maduros,

incluyendo la β3-tubulina, proteína asociada a los microtúbulos asociados a la proteína

2 (MAP2), sinaptofisina, NeuN, SAP-97, NSE, NEUROD6 y NEUROD1 [22].

Por tanto, los marcadores de diferenciación de las células de neuroblastoma SH-SY5Y

confieren a la célula morfología y funcionalidad neuronal.

En el presente trabajo se pretende conocer más a fondo los genes involucrados en el

proceso de diferenciación neuronal inducido por RA, así como los genes implicados en

la proliferación tumoral, mediante un estudio transcriptómico de células SH-SY5Y

tratadas con RA en diferentes puntos temporales.

Page 21: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

2. OBJETIVOS

Page 22: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 23: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Objetivos

11

En estudios previos en nuestro laboratorio se han realizado análisis mediante chips de

microarrays en los que se ha observado que en células SH-SY5Y de neuroblastoma

tratadas con RA durante 0, 0.5, 6, 24, 48 y 96 horas se ha producido una

sobrerregulación de ciertos marcadores de diferenciación mencionados en el apartado

1.4, como RET o NTRK2, entre muchos otros [1].

Asímismo, también con la tecnología de los microarrays, se ha detectado que los miR-

10a y -10b ejercen un papel regulador y diferenciador en estas células tratadas con RA

[24].

En ambos casos, los microarrays de expresión proporcionan una información

restringida, puesto que está limitado a las sondas presentes en el mismo.

Por ello, en el presente trabajo se proponen los siguientes objetivos:

1. Cuantificar la inducción de miR-10a y miR-10b en las células SH-SY5Y, que

serán un indicador de la diferenciación celular

2. Realizar un análisis del transcriptoma de dichas células tratadas con RA durante

0 horas (control), 24 horas y 48 horas secuenciando mediante RNA-Seq

utilizando la tecnología SOLiD, de forma que se extraiga un mayor volúmen de

información para conocer nuevas dianas y acciones del RA.

3. Analizar mediante herramientas bioinformáticas las secuencias obtenidas, así

como obtener los valores de expresión génica en cada condición.

Page 24: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 25: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

3. MATERIAL

Y

MÉTODOS

Page 26: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 27: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

15

3.1 Cultivos celulares y tratamientos

Se ha utilizado la línea celular SH-SY5Y de neuroblastoma humano, cultivada en medio

DMEM suplementado con 10% de suero fetal bovino, 2 mM L-glutamina, 100 u/ml

penicilina y 100 μg/ml estreptomicina. Estas células se han sometido a tratamiento con

ácido retinoico todo-trans (1 μM) durante 0, 24 y 48 horas.

Se han realizado dos réplicas de cada tratamiento, de forma que se han obtenido dos

placas de cada uno de los tratamientos (dos placas controles (0 horas), dos placas de 24

horas y 2 placas de 48 horas de tratamiento de RA). En este experimento no se han

realizado controles negativos.

A pesar de que existen otras líneas celulares de neuroblastoma humano, como las LAN-

1, estudios previos en nuestro laboratorio han mostrado que la inducción de miR-10a y

miR-10b es mayor en células SH-SY5Y que en las LAN-1 [24].

3.2 Extracción del RNA

Para realizar la extracción del RNA, las células se ponen en hielo y se lavan con PBS

frío. Se recogen en 500 μl de TRizol (Life Technologies), por placa de 60 mm (para

placa 100 mm, las células se recogen en 1ml de TRizol). La solución se transfiere a

tubos nuevos, y a continuación se añaden 100 μl de cloroformo, se agita en el vórtex

durante unos 15 segundos y se deja a temperatura ambiente durante unos 10-15

minutos. Posteriormente, se centrifuga a 12.000 g a 4ºC durante 15 minutos, tras lo cual

se observan tres fases diferenciadas: la fase inferior, que contiene proteínas; la fase

intermedia, que contiene DNA, y la fase acuosa superior, que contiene RNA. Se traslada

la fase acuosa superior a otro tubo, y se procede a la precipitación del RNA añadiendo

250 μl de isopropanol; se mezcla y se deja a temperatura ambiente entre 5-10 minutos,

tras lo cual se centrifuga a 12.000g a 4 ºC durante 10 minutos. Después se aspira el

sobrenadante, y se observará el pellet de RNA en el fondo del tubo, que se lavará con 1

ml de etanol al 75%. Se centrifuga a 12.000 g a 4ºC durante 10 minutos, se elimina el

sobrenadante, y se deja secar al aire durante entre 5-10 minutos, evitando que el pellet

se seque completamente. Se resuspende el pellet en 40 μl de agua libre de RNasas.

Seguidamente, se procede a determinar la concentración de RNA mediante el uso del

Nanodrop, y se guarda la muestra a -80ºC.

3.3 Electroforesis

Con el fin de visualizar la calidad del RNA y detectar posibles contaminaciones con

DNA genómico, se procede a realizar una electroforesis en gel de agarosa al 1%, con 50

ml de TAE 1X y 50 mg de agarosa, al que se le añade 0,5 μl de bromuro de etidio. Se

cargan alrededor de 400-500 ng del RNA de cada muestra y se lleva a cabo la

electroforesis a 100 V durante 30 minutos.

Page 28: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

16

3.4 Purificación del RNA

Se realiza el paso de purificación del RNA mediante tratamiento con DNAsa para

eliminar el DNA genómico e impurezas que hubieran podido quedar tras la extracción

del RNA. Esta purificación se realiza con el RNeasy Micro Kit (Qiagen), siguiendo el

protocolo incluido en este kit, que permite además concentrar el RNA. Para eliminar el

RNA ribosómico (rRNA) de las muestras se utilizó además el RiboMinus™ Eukaryote

Kit for RNA-Seq (Life Technologies), que consiste en la separación del rRNA mediante

unas sondas específicas unidas a unas bolas magnéticas. Se siguió el protocolo incluido

en el kit.

3.5 Retrotranscripción (RT) de miR-10a/10b

Tomando el RNA sin purificar guardado a -80ºC, de cada una de las muestras se realiza

una dilución 1:100, y posteriormente se coge el volumen necesario para alcanzar 10 ng

completándose hasta 5 μl con agua libre de RNasas. De cada muestra salen tres

reacciones independientes: una con sonda para miR-10a, una con sonda para miR-10b y

una con sonda para U6 (gen endógeno de referencia). De cada sonda se añaden 3 μl,

además de 7 μl de la mezcla de RT y los 5 μl de la muestra, de forma que el volumen

final de la reacción es de 15 μl. En la tabla 1 se muestran los componentes de la

reacción, y en la tabla 2 las condiciones de la amplificación.

Tabla 1. Componentes de la reacción de la retrotranscripción de miR-10a/10b

Componente Volumen (μl)

MultiScribe Retrotranscriptasa reversa 50U/ μl 1

Inhibidor de RNAsas 20U/ μl 0,19 dNTPs (100mM) 0,15 Buffer RT 10X 1,5 Agua libre de RNasas 4,16 TOTAL 7

Tabla 2. Condiciones de la RT-PCR de miR-10a/10b

Temperatura (ºC) Tiempo

16 30 42 30 80 5

5 ∞

Ambas retrotranscripciones se llevaron a cabo en un termociclador Applied Biosystems®

2720 Thermal Cycler.

3.6 Real-Time PCR

Con el fin de amplificar y cuantificar el cDNA generado en la retrotranscripción, se han

utilizado las sondas de hidrólisis TaqMan®.

En estas sondas, el donador o reporter emite fluorescencia al ser excitado, mientras el

aceptor o quencher absorbe la fluorescencia liberada por el donador. Para que esto

ocurra, las moléculas donadora y aceptora deben estar espacialmente próximas;

Page 29: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

17

solapándose además los espectros de emisión de la primera y absorción de la segunda.

Mientras la sonda está intacta, la fluorescencia emitida por el donador es absorbida por

el aceptor. Sin embargo, durante la amplificación del DNA, la sonda se hibrida con su

cadena complementaria. Al desplazarse la DNA polimerasa de Thermus aquaticus a lo

largo de la cadena en su acción de síntesis, hidroliza el extremo libre 5’ de la sonda

debido a su actividad exonucleasa, produciéndose la liberación del fluorocromo

donador. Como donador y aceptor están espacialmente alejados en este momento, la

fluorescencia emitida por el primero es captada por el lector. En este sistema, el

incremento de DNA en cada ciclo se corresponde con un aumento de la hibridación de

las sondas, lo que conlleva un aumento en la misma proporción de fluorescencia

emitida.

Otro método para llevar a cabo una RT-PCR es el basado en agentes intercalantes, como

el SYBR Green. Este método es de menor coste, pero es menos específico, puesto que el

SYBR Green se une a todo el DNA de doble cadena, detectando también contaminación

con DNA no deseado, si lo hubiera. Las sondas Taqman se generan para un gen

concreto, con lo cual en la reacción de RT-PCR sólo se mide ese gen y de esta forma se

asegura la especificidad.

Para llevar a cabo la RT-PCR, se utilizan placas MicroAmp® 96-Well Plates (Applied

Biosystems). La placa se divide en tres secciones, de tal forma que en cada una de las

secciones se realiza el ensayo para miR-10a, para miR-10b y para el gen endógeno U6,

respectivamente. De cada muestra de cDNA se realizaron tres réplicas para cada ensayo

(es decir, el control 1 se ensayaría tres veces para miR-10a, tres veces para miR-10b y

tres veces para U6), y cada reacción consta de 20 μl: 6,5 μl de agua libre de RNasas, 2,5

μl de la mezcla de RT, 10 μl de Taqman® Universal PCR Master Mix (Applied

Biosystems) y 1 μl de la sonda correspondiente. Además, se incluyen dos controles

negativos por cada ensayo, que consiste en 9 μl de agua libre de RNasas, 10 μl de

Taqman® Universal PCR Master Mix y 1 μl de la sonda correspondiente. En la tabla 3

se muestra el número de muestras y reacciones por placa, y en la tabla 4 se muestran los

componentes de la reacción y sus volúmenes correspondientes.

Tabla 3. Número de muestras y réplicas por cada ensayo de RT-PCR, incluyendo también los controles

negativos.

miR-10a miR-10b U6

Nº de muestras 6 6 6

Nº de réplicas por muestra 3 3 3

Nº de reacciones de cada muestra 9 9 9

Nº de reacciones por ensayo (nº de

controles + muestras) 14 14 14

Page 30: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

18

Tabla 4 . Componentes de la reacción de RT-PCR de miR-10a/10b

Esta Real-Time PCR se ha realizado mediante el equipo Applied Biosystems 7500 Fast

Real-Time PCR System®, el cual permite realizar una cuantificación absoluta o relativa

del DNA en la muestra. El estudio de la curva de amplificación, que consta de fase la

latencia, la fase exponencial y la fase de saturación, permite realizar un análisis

cuantitativo.

Para la cuantificación relativa se toman los valores de Ct generados en este proceso, que

indican el número de ciclos necesarios para que se produzca un aumento de

fluorescencia significativo con respecto a la señal de base, y que es inversamente

proporcional a la cantidad inicial de moléculas molde. Comparando los Ct del gen

endogéno (U6) con el gen problema (miR-10a/10b) en muestras tratadas durante 24

horas de RA, 48 horas de RA y con la muestra control, se puede determinar los cambios

relativos en la expresión de los genes miR-10a/10b. En la figura 7 se muestra un

esquema de la cuantificación relativa.

Figura 7. Cuantificación relativa en RT-PCR. Se restan los valores del Ct del gen de interés a los del Ct del gen

endógeno (∆Ct). A continuación, se realiza una resta de los valores de Ct de cada una de las muestras tratadas con la

muestra control (∆∆Ct), y mediante la ecuación 2-∆∆Ct obtenemos el cambio relativo en la expresión génica. Fuente:

http://www.eppendorf.de

3.7 Secuenciación del transcriptoma: RNA-Seq

El RNA-Seq es una tecnología deep-sequencing que permite una aproximación al perfil

transcriptómico, y proporciona una medida de los niveles de transcritos y sus isoformas

mucho más precisa que otros métodos, tales como los chips o microarrays. En general,

un conjunto de RNA se convierte en una librería de fragmentos de cDNA con

adaptadores en uno o ambos extremos. Cada molécula se secuencia en forma high-

Componente Volumen (μl)

Agua libre de RNasas 6,5 Mezcla cDNA (RT) 2,5 Mezcla Taqman® Universal PCR Master Mix: Sonda miR-10a/10b/U6: 1 μl Taqman® Universal PCR Master Mix: 10 μl

11

TOTAL 20

Page 31: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

19

throughtput para obtener secuencias cortas desde ambos extremos, en esta ocasión

(pair-ends sequencing).

Se ha utilizado la tecnología Applied Biosystem SOLiD® 5500, y tras haber obtenido el

RNA purificado conforme se describe en el apartado 3.4, se ha seguido el protocolo de

SOLiD® Total RNA-Seq Kit (Life Technologies) para preparar y generar la librería del

transcriptoma a partir de un input de 300-350 ng de RNA. En primer lugar se fragmenta

el RNA mediante hidrólisis química y se seleccionan los fragmentos de 150-200 pb

mediante el Agilent Bioanalyzer 2100 (figura 8), a continuación se construye la librería

con el transcriptoma amplificado, y por último se procede a la preparación de los

moldes para beads, según el sistema SOLiD®. En la figura 9 se muestra un esquema que

muestra el proceso descrito con más detalle.

Figura 8. Selección de los fragmentos de RNA de 150-200 pb mediante el Agilent Bioanalyzer 2100. Las gráficas

de la parte de la izquierda corresponden, de arriba a abajo, al primer pool de réplicas: Control (1), 24 horas RA (1) y

48 horas RA (1). Las gráficas de la derecha corresponden, de arriba a abajo, al segundo pool de réplicas: Control (2), 24 horas (2) y 48 horas (2).

En el proceso de amplificación de la librería de cDNA se incorporan los adaptadores

habituales P1 (dirección 5’) y P2 (dirección 3’). En este caso, el adaptador P2 posee una

particularidad, y es que contiene una secuencia correspondiente a un código de barras o

barcode y un adaptador interno (IA), que será necesario para secuenciar el barcode

(figura 9). A los fragmentos de RNA de cada muestra se le asigna un barcode diferente,

de manera que se pueden combinar todas las muestras en el mismo run (además se

Page 32: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

20

aprovecha mayor espacio en el portaobjetos o slide) y, posteriormente, se realiza el

análisis de las secuencias y se identifica qué secuencias corresponden a una muestra

determinada.

Figura 9. Esquema del protocolo SOLiD® Total RNA-Seq Kit.

Tras dicha amplificación se realiza una PCR en emulsión, siguiendo los protocolos de

Applied Biosystems y utilizando el sistema EZBead. Esta PCR consiste en la

preparación de una emulsión de agua en aceite mineral, que da lugar a microgotas que

van a funcionar como microreactores. En el interior de cada uno de estos microreactores

hay una mezcla acuosa del mix de PCR, que contiene el tampón correspondiente,

nucleótidos, DNA polimerasa, los primers de los adaptadores P1 y P2, y las bolas o

beads que llevan unidos los adaptadores P1; además de los fragmentos o moléculas de

RNA. Idealmente, en cada microreactor hay un solo fragmento de RNA, de tal forma

que una vez finalizada la PCR en emulsión, en el interior del microreactor se encuentre

una bead en la que se ha amplificado un solo tipo de fragmento de RNA.

Posteriormente, se realiza un enriquecimiento de beads, separando las que poseen las

cadenas molde extendidas de las que no han unido de fragmentos de RNA ni ha tenido

lugar la amplificación. Las cadenas molde de las beads seleccionadas se modifican por

su extremo 3’ para permitir una unión covalente al portaobjetos de vidrio o slide. En la

figura 10 se muestra un esquema del proceso descrito.

Page 33: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

21

Figura 10. PCR en emulsión y enriquecimiento de las beads. En la parte de arriba de la figura aparecen los

componentes que están presentes en cada microreactor (el fragmento de RNA con sus adaptadores unidos, los primers P1 y P2, la DNA polimerasa, las beads con los adaptadores P1 unidos), aunque no se muestran en la

ilustración, también se incluirían los nucleótidos y el tampón correspondiente para que se lleve a cabo la reacción de

PCR. En la parte de abajo se muestra que, tal y como se menciona en el texto, en cada microreactor hay una sola

molécula de RNA. Posteriormente se procede al enriquecimiento de las beads, en la que éstas quedan cubiertas por fragmentos de un solo tipo en cada microreactor. El extremo de todos estos fragmentos unidos a beads se modifican

por su extremo 3’ para su unión al slide.

Estas beads modificadas se depositan en el slide, y una vez unidas, comienza la

secuenciación por ligación. Los primers de la reacción de secuenciación se hibridan a la

región adaptadora P1 en cada cadena molde unida a la bead. Un conjunto de cuatro

sondas di-base marcadas de forma fluorescente compiten por la ligación al primer de

secuenciación (con estas sondas se leen dos pares de bases, lo cual evita falsos

positivos). Se realizan múltiples ciclos de ligación, detección del fluorocromo y corte

del mismo con un número de ciclos que determinan la longitud de la lectura. Tras estas

series de ciclos de ligación, la extensión del producto se elimina y se reinicia la cadena

molde para una segunda ronda de ciclos de ligación, que comienza por la posición n-1

con respecto a la ligación del primer inicial (figura 11).

En el caso del presente estudio, la secuenciación se realiza por pair-ends, y se

secuencian 50 pb comenzando por el extremo 3’ (F3) y 35 pb comenzando por el

extremo 5’ (F5) del fragmento de cDNA (figura 12).

Tal y como se ha mencionado anteriormente, las secuencias de cada muestra se han

identificado mediante un barcode intercalado entre el fragmento de cDNA y el

adaptador P2. De este barcode se secuencian 5 pb para poder identificar cada una de las

secuencias con la muestra correspondiente.

Page 34: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

22

Figura 11. Esquema de la secuenciación por ligación. En (A), el primer inicial se une a la secuencia adaptadora P1.

A su vez, a este primer se liga a una de las cuatro sondas mediante la ligasa. Se detecta el fluorocromo, se corta, y se

liga a continuación la siguiente sonda. En (B) se muestra un ejemplo de detección de los fluorocromos y cómo a partir de éstos se descodifican las bases nucleotídicas. En (C) se muestra la posición de las lecturas, así como las

veces que se ha leido una posición en cada ronda una vez se han completado los ciclos de ligación.

A

B

C

Page 35: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

23

Figura 12. Secuenciación en SOLiD por pair-ends.

3.8 Obtención y mapeado de las secuencias.

El resultado de este proceso de secuenciación es la generación de dos tipos archivos:

uno incluye las secuencias en color o colour space y el otro es un archivo de calidad.

Ambos archivos se juntan para generar los archivos .fastq, que incluyen las lecturas de

50 y 35 pb, tal y como se muestran en la figura 12. Estas secuencias se alinean y

mapean frente al genoma de referencia humano hg19/GRCh37.73 utilizando el

programa TopHat 1.4.1 [25] que a su vez produce archivos .bam. En cada uno de estos

archivos se encuentra la posición de cada lectura en el genoma de referencia.

3.9 Análisis de las secuencias: Qualimap y NOISeq

3.9.1 Qualimap

Para conocer cuáles y cuántos genes del genoma de referencia están presentes en las

muestras se utiliza la aplicación Qualimap [26] en la cual se agrega el archivo .bam de

una muestra determinada y el archivo correspondiente al genoma de referencia en

formato .gtf. Este proceso genera un archivo .counts que cuantifica los genes de la

muestra en relación a los genes que aparecen en el genoma de referencia (figura 13).

Figura 13 Capturas de pantalla Qualimap y el output generado. En la imagen A se muestra una captura de

pantalla de la aplicación Qualimap. En la imagen B se muestra el archivo de texto .bam que genera el Qualimap, en este caso de la muestra control 1. En esta última imágen, nótese que en la columna izquierda se encuentran los

identificadores de los genes, y en la columna derecha se muestra los counts que tiene cada uno de los genes en la

muestra control 1.

A B

Page 36: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

24

Con el Qualimap se generan dos grupos de archivos .counts: uno se ha generado

mediante el protocolo strand-specific-foward y el otro mediante el protocolo strand-

specific-reverse. En el primer caso, para lecturas en pair-ends, la primera lectura del par

debe mapear en la misma cadena que el gen o feature; mientras que la segunda se

mapea en la cadena antisentido. En el segundo caso, considerando también lecturas en

pair-ends, la primera lectura del par debe mapear en la cadena antisentido; mientras que

la segunda lectura debe mapear en la misma cadena que el o gen o feature. Esto se

traducirá en que, en cada una de las muestras de los grupos de archivos .counts en

reverse y foward, habrá un mayor o menor número de lecturas. Escogeremos pues

aquel grupo cuyas muestras tengan un mayor número de lecturas sumando los conteos

para cada gen, que en este caso es el foward. Todos los datos de los counts de cada

muestra en foward se agrupan en un único archivo de formato .txt, con el que trabajará

en el siguiente análisis.

3.9.2 NOISeq

Estos datos se analizan mediante el paquete de NOISeq [27,28] de Bioconductor en la

plataforma R. Con este paquete se lleva a cabo una aproximación no paramétrica para la

identificación de genes diferencialmente expresados desde los datos de los counts.

Permite la visualización de la distribución de los datos brutos, así como su

normalización y la cuantificación de la expresión diferencial.

NOISeq computa la expresión diferencial de los datos con réplicas técnicas y/o

biológicas (para éstas últimas, se utilizará una variante del NOISeq, llamada

NOISeqbio). Este método calcula dos estadísticos de expresión diferencial para cada gen

o característica: el valor M, que se define como el logaritmo en base 2 del ratio entre

dos condiciones; y el valor D, que se define como el valor absoluto de la diferencia

entre condiciones. Para evitar valores de M infinitos o indeterminados, los niveles de

expresión igual a 0 son reemplazados una constante dada k > 0 (se establece una k =

0.5). Se considera que una característica está diferencialmente expresada si sus

correspondientes valores M y D son lo suficientemente altos como para superar el ruido

o noise. La distribución del ruido se obtiene mediante la comparación de todas las

réplicas dentro de la misma condición.

Además, por comparación de los valores M y D de una característica dada frente al

ruido de distribución, NOISeq obtiene la “probabilidad de expresión diferencial” (q)

para esta característica. Si el resultado de la división de la probabilidad de expresión

diferencial entre la probabilidad de expresión no diferencial es mayor que un cierto

umbral, la característica se considera como diferencialmente expresada entre las

condiciones. Por defecto, se considera que una característica está diferencialmente

expresada cuando existe un ratio 4:1, es decir, cuando la característica está 4 veces más

expresada diferencialmente que no expresada diferencialmente. Esto se traducirá en q =

0,8, y este valor será el umbral por el cuál se determina si hay más o menos genes

expresados de forma diferencial (a mayor valor de q, más alto se pone el umbral y

habrán menos genes diferencialmente expresados entre dos condiciones, y viceversa).

Para realizar el cálculo de los valores M y D, NOISeq realiza la normalización de los

counts de cada muestra por la media truncada de los valores M (trimmed mean of M

values o TMM). Este método de normalización se basa en la asunción de que la mayoría

de los genes no están diferencialmente expresados, y es consistente con la posterior

validación de los genes diferencialmente expresados por RT-PCR [28].

Page 37: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Material y métodos

25

3.9.3 Análisis de enriquecimiento de términos Gene Ontology (GO)

Para este análisis se utiliza el paquete GOseq [29] de Bioconductor, que también se

ejecuta en la plataforma R. Este paquete proporciona métodos para realizar el análisis de

Gene Ontology de los datos teniendo en cuenta el sesgo de la longitud o length bias de

los genes, que es característico de los datos de RNA-Seq.

Este análisis tiene la finalidad de agrupar los genes por categorías de términos GO para

conocer cuáles son las rutas biológicas que están sobre e infraexpresadas durante 24 y

48 horas de tratamiento con RA respecto al control.

Una vez generadas las listas de genes que están diferencialmente expresados para las

diferentes condiciones por NOISeq (en este caso de 24 y 48 horas), se procede a realizar

un análisis de enriquecimiento de los términos GO. Para ello se genera un archivo que

recopila todos los términos GO referidos al genoma humano desde el BioMart de la

página web Ensembl Genome Browser (http://www.ensembl.org/), para así poder cruzar

esta lista con la lista de genes diferencialmente expresados en 24 y 48 horas de

tratamiento con RA.

Para realizar este análisis, en primer lugar se calcula el PWF (probability weighting

function), que cuantifica el length bias de los datos para cada muestra. Ello da la

probabilidad de que un gen esté diferencialmente expresado sólo en función de su

longitud. Posteriormente, con las probabilidades PWF resultantes se aplica el método

Wallenius, que calcula la sobre e infraexpresión entre los genes diferencialmente

expresados en forma de p-valores. Por último, con el fin de controlar el FDR (false

discoverty rate), estos p-valores son ajustados mediante el método Benjamini &

Hochberg, y se establece como límite p-valores ajustados menores de 0.1; por tanto

cuanto menor sea el p-valor ajustado, más significativo será.

Page 38: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 39: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

4. RESULTADOS

Y

DISCUSIÓN

Page 40: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 41: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

29

4.1 Electroforesis del RNA total y detección de contaminaciones

Tras la extracción del RNA de las células tratadas a diferentes tiempos, se ha realizado

una electroforesis en gel de agarosa al 1% para visualizar la calidad del RNA y detectar

posibles contaminaciones por DNA genómico. Esta electroforesis se muestra en la

figura 14.

Figura 14. Electroforesis del RNA total. En A se muestra la banda correspondiente al DNA genómico, en B se muestran las bandas correspondientes a RNA ribosómico (28S la banda superior y 18S la banda inferior), en C se

muestran las bandas correspondientes a los microRNAs. La carrera de la izquierda corresponde al marcador de 1 Kpb.

4.2 Purificación de RNA

En la electroforesis inicial (figura 14) se puede observar la presencia de DNA genómico

en todas las muestras, así como de los RNA ribosómicos 28S y 18S. Para eliminar

ambas interferencias, se procede a realizar la purificación de RNA tal y como se

describe en el apartado 3.4, eliminando primero el DNA genómico y posteriormente los

RNAs ribosómicos. En la figura 15 se muestra una electroforesis del RNA purificado

tras cada uno de los métodos de purificación.

Figura 15. Electroforesis tras purificación con RNeasy Micro Kit y el RiboMinus™ Eukaryote Kit for RNA-Seq.

En la imagen A se muestra la electroforesis del RNA purificado con RNeasy Micro Kit. El asterisco (*) muestra las

bandas correspondientes al RNA ribosómico (28S la supeior y 18S la inferior). En la imagen B se muestra la

electroforesis del RNA purificado con RiboMinus™ Eukaryote Kit for RNA-Seq. La flecha (←) indica las bandas del

RNA ribosómico, mucho menos intensas que en la imagen A. A diferencia de la electroforesis mostrada en la figura 14, en la parte inferior ya no se aprecia los microRNAs.

A

B

*

Page 42: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

30

4.3 Retrotranscripción y RT-PCR de miR-10a y miR-10b

Con el RNA sin purificar se realiza una retrotranscripción específica para miR-10a y

miR-10b, con los componentes y las condiciones que se detallan en el apartado 3.5.

Posteriormente, se lleva a cabo un ensayo de RT-PCR para determinar la inducción de

miR-10a y miR-10b mediante el tratamiento con RA de cada una de las muestras, con

las especificaciones de componentes y condiciones que se muestran en el apartado 3.6.

En la figura 16 se muestra la gráfica resultante de la RT-PCR.

Los resultados de la RT-PCR de miR-10a y miR-10b son consistentes con lo que ya se

había corroborado anteriormente en otros proyectos del laboratorio. Efectivamente, el

RA induce los miRNA-10a y miRNA-10b, promoviendo la diferenciación celular.

Figura 16. Gráficas resultantes de la RT-PCR de miR-10a y miR-10b. En A se muestra la RT-PCR con respecto al control 1. En B se muestra la RT-PCR con respecto al control 2. A pesar de que en ambos casos se aprecia una

tendencia ascendente cuanto mayor es la duración del tratamiento con RA, en la segunda réplica parece haber mayor

diferencia entre control, 24 y 48 horas que en la primera réplica.

4.4 Análisis de las secuencias

El paquete NOISeq permite tanto computar la expresión diferencial entre dos

condiciones como realizar un análisis previo de calidad de los datos. Este análisis de

calidad consiste, entre otras cosas, en visualizar la detección de los biotipos, la

distribución de las muestras, la profundidad de secuenciación, la distribución de los

datos mediante un análisis de los componentes principales (PCA) tanto de los genes

como de las muestras, así como el contenido en GC y la relación entre la longitud de un

gen y los valores de expresión. A continuación se mostrarán las gráficas y figuras más

significativas del análisis de calidad.

B A

Page 43: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

31

4.4.1 Biodetección

En este análisis de detección de biotipos se muestra qué tipo de características han sido

detectadas (figura 17). En general, cuando las características son genes, se espera que la

mayoría de ellos sean protein coding.

Figura 17. Biodetección de las muestras control, 24 horas y 48 horas.

Page 44: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

32

La identificación de los distintos biotipos se realiza mediante la comparación entre el

archivo que contiene los counts para cada gen y un archivo llamado biomart generado a

partir del Ensembl Genome Browser (http://www.ensembl.org/), que contiene

información acerca de a qué biotipo corresponde cada gen, en qué cromosoma se

encuentra, el inicio y final del gen en pares de bases y cuál es su contenido en GC; todo

ello con respecto al genoma humano h19.

En la figura 17, las barras grises muestran el porcentaje de cada biotipo en el genoma

de referencia humano h19, las barras rayadas muestran qué proporción de cada biotipo

ha sido detectado en la muestra con respecto al genoma (se excluyen aquellas

características que tengan 0 counts), y las barras sólidas azules o rojas muestran el

porcentaje de cada biotipo dentro de la muestra. La línea discontinua separa los biotipos

más abundantes de resto.

De las gráficas generadas en este análisis se deduce que en las tres condiciones

aparecen como biotipos más relevantes los protein coding, pseudogenes y lincRNAs

(long intergenic non-coding RNAs), siendo los protein coding los que abarcan

aproximadamente el 60%. Dentro de los biotipos menos abundantes, destacan, por este

orden, los miscRNAs, los sense intronic, snoRNAs (small nucleolar RNAs), snRNAs

(small nuclear RNAs), transcritos procesados, miRNAs, sense overlapping, y rRNAs.

La primera conclusión de este análisis es que la distribución de biotipos es similar en

todas las muestras, lo que confirma que los procesos de purificación de RNA han sido

homogéneos para todas ellas, aunque el hecho de que aparezca un pequeño porcentaje

de rRNAs indica que la purificación no ha sido todo lo eficaz que se hubiera deseado.

La segunda conclusión de la detección de biotipos es la elevada proporción de genes

antisense detectados. Esto se debe a la utilización del protocolo de SOLiD que preserva

la información de hebra expresada, por lo que es posible detectar genes expresados en

antisense.

En general se podría decir que, aunque hay una elevado porcentaje de protein coding,

predomina la parte regulatoria mediante RNAs.

4.4.2 Counts por biotipo

En este análisis se muestra cómo se distribuyen los counts dentro de cada grupo

biológico/biotipo y en cada muestra (figura 18). En la parte de arriba de la gráfica se

muestran el número de biotipos detectados. Ello se traducirá en que el rango de

expresión de cada biotipo será más o menos amplio dentro de una muestra, indicando la

representatividad que tiene cada biotipo en la misma.

En la figura 18 se muestran los counts por biotipo de las muestras correspondientes a la

réplica 1. Las muestras correspondientes a la réplica 2 son iguales a las de la réplica 1,

es por ello que se omitirán las figuras correspondientes a la réplica 2.

Lo que más destaca en las tres muestras es lo elevada que está la expresión de los rRNA

mitocondriales. Estos genes acaparan valores cercanos al millón de counts, lo que

puede distorsionar los análisis estadísticos. La posterior utilización del algoritmo TMM

(trimmed mean of M values) en la normalización de datos tiene en cuenta la presencia

de genes con valores extremos y los ignora.

Page 45: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

33

Después de estos dos genes mitocondriales, son los genes protein coding los que tienen

el mayor número de lecturas, y rango de expresión, lo cual quiere decir que son los que

acumulan la mayor parte de la información trasncripcional del set de datos, tal y como

se esperaba.

El valor mediano de protein coding alrededor de 100 counts indica que una buena parte

de los genes tienen buenos niveles de detección, aunque hay muchos genes protein

coding que estan detectados con muy bajos counts.

Los biotipos que muestran un rango más amplio de expresión son los protein coding,

los lincRNAs, los antisense, los snoRNAs, los transcritos procesados, los pseudogenes,

los sense overlapping y los sense intronic. A excepción de los rRNAs mitocondriales,

los biotipos con más amplio rango de expresión coinciden con la biodetección de la

figura 17.

4.4.3 Contenido en GC

En este análisis se estudiará la relación entre el contenido en GC y los valores de

expresión. En la figura 19 se muestra el contenido en GC de cada una de las

condiciones.

En los tres casos las curvas tienen la misma tendencia. Cada punto representa 200 genes

o características ordenadas según su contenido en GC y expresión, el parámetro R2

indica cómo de bueno es el ajuste de la curva y el p-value se obtiene por comparación

entre el contenido en GC y la expresión media.

Cuanto más alto es el valor de R2 y más bajo es p-value, mayor ajuste de la curva y

mayor relación entre contenido en GC y expresión, respectivamente; y esto es

precisamente lo que se observa en la figura 19.

Es posible que el hecho de que haya una preferencia de expresión de aquellos genes que

tengan menos contenido en GC se deba a un sesgo producido en alguno de los pasos de

amplificación durante el procesamiento de las muestras para la secuenciación.

Por tanto, en este análisis se detecta una dependencia del contenido en GC con la

expresión, debida probablemente a un sesgo producido en la amplificación por PCR

durante el procesamiento de las muestras para la secuenciación. Esto condiciona la

capacidad de detectar expresión diferencial.

A pesar de que en el presente trabajo no se ha realizado ninguna corrección de los

resultados ya que se ha preferido mostrar los datos “brutos” de los análisis, debería

realizarse una corrección del contenido en GC.

4.4.4 Length bias

En este análisis se muestra la relación existente entre la longitud del gen o característica

y su valor de expresión, o dicho de otra forma, si el hecho de que los transcritos sean

largos o cortos influye en la expresión diferencial (figura 20). También en esta ocasión,

cada punto representa 200 genes o características ordenadas según se longitud y

expresión.

En las gráficas superiores de la figura 20 se observa que hay relación entre la longitud

del gen y su expresión. Sin embargo, en los tres casos, parece ser que se ha establecido

esa relación en base a un punto que está muy alejado del resto. Si obviáramos este

Page 46: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

34

punto e hiciéramos una ampliación o zoom en la parte derecha de la gráfica (gráficas

inferiores de la figura 20), esta correlación dejaría de establecerse o sería débil. En la

normalización utilizada, TMM, no se corrige explicitamente por la longitud del gen.

Por tanto, si se considera el punto más distante del resto como outlayer, se observa que

no hay una relación clara entre la longitud del gen y su expresión, por lo que los

transcritos cortos y largos se expresarían por igual.

Page 47: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

35

Figura 18. Counts por biotipo para las condiciones de la réplica 1.

Page 48: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

36

Figura 19. Contenido en GC para las muestras control, 24 y 48 horas.

Page 49: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

37

Figura 20. Length bias de las muestras control, 24 y 48 horas. En la parte superior se ve la gráfica completa de

cada condición, y en la parte inferior la ampliación o zoom correspondiente a cada condición.

Zoom Zoom Zoom

Page 50: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

38

4.4.5 Profundidad de secuenciación

En este análisis se muestra la profundidad de secuenciación para cada muestra

correspondiente a protein coding, así como el porcentaje de características detectadas

(figura 21).

Figura 21. Profundidad de secuenciación. Se muestra cada una de las muestras y sus réplicas correspondiente a

protein coding, y el porcentaje de características detectadas en cada muestra.

En la figura 21, los puntos sólidos corresponden a la profundidad de secuenciación real,

mientras que el resto de puntos superiores e inferiores a éstos son el resultado de una

simulación a partir de los valores reales de profundidad de secuenciación. La muestra

que menos millones de lecturas tiene es 24 horas RA 1, seguido de 48 horas RA 2,

control 2, 24 horas RA 2, control 1 y 48 horas RA 1. El rango de profundidad de

secuenciación es de 11 a 20 millones de lecturas, aproximadamente.

La profundidad de secuenciación esperada es de aproximadamente 100 millones de

lecturas para la secuenciación por SOLiD. Sin embargo, la muestra que más

profundidad de secuenciación tiene es 48 horas RA 1, con 20 millones de lecturas,

siendo el rango de profundidades de secuenciación de entre 10 y 20 millones de

lecturas. Aún así en todas las muestras se detecta entre 14.000 y 14.500 genes, lo cual

es un valor relativamente bien ajustado.

Se debe tener en cuenta que tras la obtención de las secuencias hay un filtrado de

lecturas considerable en el paso de mapeado. Esto significaría que, o bien la calidad de

Page 51: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

39

las propias secuencias, o bien el propio proceso de secuenciación, no ha sido lo

suficiente bueno y se ha descartado un gran porcentaje de lecturas.

El sistema de secuenciación Illumina posee una eficiencia de mapeo mayor, además de

mayor precisión en la secuenciación en la cobertura [30].

Por tanto, de este análisis se concluye que el número de lecturas de las muestras ha sido

menor de los que se esperaba (de 10 a 20 millones, comparado con los 100 millones de

lecturas esperados), siendo la muestra de 48 horas RA 1 la que mayor número de

lecturas tiene (20 millones de lecturas) y la muestra 24 horas RA 1 la que menos

lecturas tiene (10 millones de lecturas).

4.4.6 Distribución de los counts en cada muestra y normalización

En este análisis se muestra la distribución de los counts y la normalización de los

mismos mediante TMM (trimmed mean of M values). (figura 22),

Figura 22. Distribución de los counts. Se presenta esta distribución en cada una de las muestras (gráfica superior,

que muestra los counts brutos o raw counts), así como la normalización de esos counts mediante el TMM (gráfica inferior).

Page 52: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

40

A pesar de que no hay demasiada variabilidad entre las muestras, en la figura 22 puede

observarse que las muestras control 1, 24 horas RA 2 y 48 horas RA 1 son las que más

counts distribuidos tiene en la gráfica superior de Raw counts. Esto se elimina con la

normalización TMM, que iguala todas las muestras. El fundamento de la normalización

por TMM se detalla en el apartado 3.9.2.

En este apartado se ha pretendido mostrar la normalización de los datos por TMM

respecto a la distribución original de los datos, ya que esta es la normalización que se

va a aplicar en análisis posteriores.

4.4.7 Análisis de componentes principales (PCA)

Mediante este análisis se pretende conocer tanto la distribución de los genes, mediante

los loading plots; como la distribución de las muestras, mediante los score plots; y si

éstas son homogéneas o uniformes. Además, en los score plots se podrá observar cómo

se comportan unas muestras respecto a otras. En ambos casos, la distribución se realiza

en base a los datos normalizados por TMM y al logaritmo en base 2 de TMM.

En la figura 23 se muestran los loading plots. En el loading plot correspondiente a la

figura 23A se observa que hay un gen que está mucho más distante que el resto

(mostrado dentro del círculo rojo).

Figura 23. Loading plots. La imagen A muestra el loading plot obtenido con los datos normalizados por TMM. La

imagen B muestra el loading plot con el log2 de los datos normalizados por TMM.

ENSG00000210082 mitochondrially encoded 16S RNA

B

A

Page 53: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

41

Este gen es el ENSG00000210082, que corresponde al rRNA mitocondrial 16S. Puesto

que en las muestras sólo hay dos biotipos correspondientes a rRNA mitocondrial, se

decide excluir este biotipo del análisis, puesto que acapara un número de counts

considerables (figura 18) y podría interferir en posteriores análisis.

En el loading plot correspondiente a la figura 23B se observa que en la parte izquierda

hay tres genes que están distantes del resto. Estos tres genes son protein codings y

corresponden al citocromo CYP26B1, al citocromo CYP26A1 y a la

deshidrogenasa/reductasa DHRS3, y están implicados en el metabolismo del ácido

retinoico. Observando los counts que tienen estos tres genes en cada muestra,

encontramos que el control 2 tiene unos counts elevados de estos genes, con valores

muy próximos a los de 24 y 48 horas. Esto no tendría que ser así puesto que en los

controles, al no haber recibido tratamiento de RA, no deberían activarse o expresarse

genes relacionados con el metabolismo del mismo.

En la figura 24 se muestran los score plots. En el score plot correspondiente al TMM

(figura 24A) sólo la PC1 (componente principal 1) explica la variabilidad de las

muestras; mientras que el correspondiente al log2TMM (figura 24B) explica la

variabilidad mediante PC1 y PC2. En ambos casos, se observa que el control 2 queda

mucho más cerca de 24 y 48 horas que de su misma réplica, el control 1.

Figura 24. Score plots. La imagen A corresponde al score plot obtenido por la normalización de los datos TMM. La imagen B corresponde al score plot obtenido por el logaritmo en base 2 de los datos normalizados por TMM.

A

B

Page 54: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

42

Idealmente, las muestras más parecidas deberían agruparse entre sí (los controles entre

sí, los tratamientos de 24 horas entre sí y los tratamientos de 48 horas entre sí). Sin

embargo, en el score plot correspondiente a log2TMM (figura 24B) se observa que el

control 2 agrupa con 24 horas RA 2 y 48 horas RA 1, y no con el control 1, lo cual

coincide con lo observado en el loading plot de log2TMM (figura 23B). Además, puede

apreciarse que las muestras de 24 horas y 48 horas son más parecidas que las réplicas

entre sí.

Esta anormalidad en el agrupamiento de las muestras, y más concretamente del control

2, nos lleva a excluir esta muestra del análisis, lo cuál limita el poder estadístico de los

análisis posteriores, pero que se considera necesario para poder hacer un análisis con un

mínimo de sentido.

Este agrupamiento inadecuado puede haberse producido durante el procesamiento de las

muestras para la secuenciación mediante un error de manipulación de las muestras,

mezcla de las mismas o cambio de etiquetas. Esta última sería menos probable, dado

que no hay ninguna otra muestra que posea valores similares al control 1 en cuanto a los

genes que se muestran en el loading plot de log2TMM de la figura 23B.

El hecho de que las muestras de 24 y 48 horas se parezcan más entre sí que sus propias

réplicas (figura 24B) podría significar que realmente el patrón de expresión en ambos

puntos temporales no difiere tanto como se esperaría en un principio, a pesar de que

estudios anteriores en el laboratorio han confirmado que realmente hay una separación

de las muestras de 24 y 48 horas [1]. En el caso del presente trabajo, habría sido

necesario tomar un punto temporal de tratamiento más distante (por ejemplo, 96 horas)

para saber si hay un cambio de patrón de expresión génica agudo a largo plazo.

Por tanto, en base a los resultados mostrados en el loading plot de TMM (figura 23A) se

ha dedicido excluir del análisis los rRNAs mitcondriales, ya que acaparan gran parte de

los counts, tal y como se muestra en la figura 18.

En el loading plot de log2TMM (fugura 23B) se ha detectado que el control 2 tiene

counts muy similares en cuanto a los genes CYP26A1, CYP26B1 y DHRS3,

relacionados con el metabolismo de RA, a los de las muestras de 24 y 48 horas.

Además, los resultados mostrados en los score plots revelan que hay un agrupamiento

inadecuado de las muestras, siendo la muestra control 2 la que más difiere con respecto

a su réplica. Es por ello que se ha decidido excluir esta muestra de los análisis

posteriores.

4.5 Expresión diferencial

El objetivo de la obtención de los valores M de expresión diferencial es la generación de

listas de genes sobre e infraexpresados con el tratamiento con RA durante 24 y 48 horas

con respecto al control. En estas listas se muestra el valor M de expresión diferencial y

la probabilidad de expresión diferencial cuando se fija un valor de q = 0.8, que indica un

umbral en el que un gen va a estar 4 veces más expresado diferencialmente que no

expresado diferencialmente. Todo lo que está por encima o por debajo de este umbral

será detectado como sobreexpresado o no diferencialmente expresado, respectivamente.

Dado que se ha excluido una de las réplicas control (control 2), no se puede realizar un

análisis basado en réplicas técnicas y/o biológicas, por lo que se usará NOISeq en vez de

NOISeqbio para computar los valores M de expresión diferencial. Es por ello que estos

Page 55: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

43

valores M se han podido obtener para 24 y 48 horas pero no para el control 1. Por tanto,

se han obtenido los genes diferencialmente expresados en 24 horas con respecto al

control 1, y los genes diferencialmente expresados en 48 horas con respecto al control 1.

Además, se ha realizado el análisis para detectar genes diferencialmente expresados

entre 24 y 48 horas. En este caso, no se han obtenido genes diferencialmente

expresados, lo que apoyaría lo observado en loading plots y score plots (figuras 23 y

24).

Con el tratamiento con RA durante 24 horas, se han detectado 118 genes

sobreexpresados (tabla 5) y 32 infraexpresados respecto al control 1 (0 horas) (tabla 6);

mientras que con el tratamiento con RA durante 48 horas se han detectado 93 genes

sobreexpresados (tabla 7), y 23 genes infraexpresados (tabla 8

).

De las listas de genes sobreexpresados en 24 y 48 horas cabe destacar que, a pesar de

que en la RT-PCR realizada se observa una inducción de los miR-10a y miR-10b con el

tratamiento de RA, sus transcritos no han sido detectados. Por ello, convendría realizar

experimentos de sobreexpresión e interferencia de estos miRNAs para testar si los

genes de interés en neuroblastoma y su diferenciación neuronal inducida por RA

interaccionan con ellos o si su expresión se ve afectada por la sobreexpresión o bloqueo

de los miR-10a y miR-10b mediante la transfección de pre-miRs o anti-miRs,

respectivamente.

Además, aunque la gran mayoría de genes detectados son protein codings, se han

detectado snoRNAs (small nucleolar RNAs), lincRNAs (long intergenic non-coding

RNAs), genes sense overlapping y pseudogenes. Los snoRNA y lincRNA podrían estar

desempeñando un papel regulador; mientras que habría que esclarecer mediante

estudios adicionales la implicación de los genes sense overlapping y los pseudogenes en

la diferenciación celular, aunque cabría la posibilidad de que los pseudogenes sean

artefactuales debido a la calidad de las lecturas o al método de mapeo utilizado.

En el siguiente apartado estos genes serán clasificados en categorías GO para conocer

en qué rutas biológicas participan.

Page 56: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

44

Tabla 5. 118 genes sobreexpresados tras 24 horas de tratamiento con RA, respecto al Control 1 (0 horas).

Gene ID Gene Name Description Biotype M prob

ENSG00000003137 CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1

protein coding 10,280 0,984

ENSG00000095596 CYP26A1 cytochrome P450, family 26, subfamily A, polypeptide 1

protein coding 7,928 0,993

ENSG00000082929 C4orf6 chromosome 4 open reading frame 6 protein coding 6,904 0,802

ENSG00000162496 DHRS3 dehydrogenase/reductase (SDR family) member 3 protein coding 6,742 0,999

ENSG00000196167 COLCA1 colorectal cancer associated 1 protein coding 5,439 0,890

ENSG00000163331 DAPL1 death associated protein-like 1 protein coding 5,174 0,935

ENSG00000198732 SMOC1 SPARC related modular calcium binding 1 protein coding 4,577 0,911

ENSG00000148053 NTRK2 neurotrophic tyrosine kinase, receptor, type 2 protein coding 4,378 0,999

ENSG00000074966 TXK TXK tyrosine kinase protein coding 4,037 0,907

ENSG00000154654 NCAM2 neural cell adhesion molecule 2 protein coding 3,974 0,998

ENSG00000136960 ENPP2 ectonucleotide pyrophosphatase/phosphodiesterase

2 protein coding 3,912 0,963

ENSG00000111341 MGP matrix Gla protein protein coding 3,752 0,989

ENSG00000155011 DKK2 dickkopf WNT signaling pathway inhibitor 2 protein coding 3,225 0,988

ENSG00000135914 HTR2B 5-hydroxytryptamine (serotonin) receptor 2B, G protein-coupled

protein coding 3,111 0,932

ENSG00000183287 CCBE1 collagen and calcium binding EGF domains 1 protein coding 3,081 0,970

ENSG00000081923 ATP8B1 ATPase, aminophospholipid transporter, class I,

type 8B, member 1 protein coding 3,023 0,914

ENSG00000198959 TGM2 transglutaminase 2 protein coding 3,021 0,973

ENSG00000116183 PAPPA2 pappalysin 2 protein coding 2,910 0,927

ENSG00000066382 MPPED2 metallophosphoesterase domain containing 2 protein coding 2,854 0,980

ENSG00000106034 CPED1 cadherin-like and PC-esterase domain containing 1 protein coding 2,843 0,968

ENSG00000166510 CCDC68 coiled-coil domain containing 68 protein coding 2,804 0,947

ENSG00000143320 CRABP2 cellular retinoic acid binding protein 2 protein coding 2,796 0,961

ENSG00000169429 IL8 interleukin 8 protein coding 2,770 0,905

ENSG00000150672 DLG2 discs, large homolog 2 (Drosophila) protein coding 2,755 0,973

ENSG00000077092 RARB retinoic acid receptor, β protein coding 2,724 0,983

ENSG00000162630 B3GALT2 UDP-Gal:betaGlcNAc beta 1,3-

galactosyltransferase, polypeptide 2 protein coding 2,634 0,800

ENSG00000106484 MEST mesoderm specific transcript protein coding 2,363 0,951

ENSG00000238835 SCARNA18 small Cajal body-specific RNA 18 snoRNA 2,331 0,868

ENSG00000123700 KCNJ2 potassium inwardly-rectifying channel, subfamily J, member 2

protein coding 2,262 0,885

ENSG00000148677 ANKRD1 ankyrin repeat domain 1 (cardiac muscle) protein coding 2,238 0,915

ENSG00000165731 RET ret proto-oncogene protein coding 2,209 0,950

ENSG00000145632 PLK2 polo-like kinase 2 protein coding 2,198 0,942

ENSG00000078098 FAP fibroblast activation protein, alpha protein coding 2,186 0,804

ENSG00000064692 SNCAIP synuclein, alpha interacting protein protein coding 2,176 0,872

ENSG00000111339 ART4 ADP-ribosyltransferase 4 protein coding 2,107 0,854

ENSG00000122641 INHBA inhibin, beta A protein coding 2,106 0,934

ENSG00000104626 ERI1 exoribonuclease 1 protein coding 2,101 0,946

ENSG00000168405 CMAHP cytidine monophospho-N-acetylneuraminic acid

hydroxylase, pseudogene pseudogene 2,025 0,879

ENSG00000207392 SNORA20 small nucleolar RNA, H/ACA box 20 snoRNA 2,022 0,890

ENSG00000155974 GRIP1 glutamate receptor interacting protein 1 protein coding 2,007 0,806

ENSG00000125398 SOX9 SRY (sex determining region Y)-box 9 protein coding 1,974 0,854

ENSG00000112769 LAMA4 laminin, alpha 4 protein coding 1,970 0,937

ENSG00000151892 GFRA1 GDNF family receptor alpha 1 protein coding 1,959 0,894

ENSG00000163293 NIPAL1 NIPA-like domain containing 1 protein coding 1,947 0,868

ENSG00000128510 CPA4 carboxypeptidase A4 protein coding 1,944 0,910

ENSG00000054598 FOXC1 forkhead box C1 protein coding 1,941 0,933

ENSG00000260391 RP11-71H17.7 sense overlapping 1,899 0,851

ENSG00000250588 IQCJ-SCHIP1 IQCJ-SCHIP1 readthrough protein coding 1,898 0,861

Page 57: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

45

ENSG00000234944 RP11-124O11.1 lincRNA 1,891 0,844

ENSG00000175879 HOXD8 homeobox D8 protein coding 1,883 0,927

ENSG00000174600 CMKLR1 chemokine-like receptor 1 protein coding 1,815 0,849

ENSG00000259865 RP11-488L18.10 lincRNA 1,790 0,874

ENSG00000150938 CRIM1 cysteine rich transmembrane BMP regulator 1

(chordin-like) protein coding 1,785 0,849

ENSG00000164125 FAM198B family with sequence similarity 198, member B protein coding 1,773 0,878

ENSG00000188133 TMEM215 transmembrane protein 215 protein coding 1,770 0,869

ENSG00000151687 ANKAR ankyrin and armadillo repeat containing protein coding 1,762 0,839

ENSG00000114315 HES1 hairy and enhancer of split 1, (Drosophila) protein coding 1,761 0,825

ENSG00000212443 SNORA53 small nucleolar RNA, H/ACA box 53 snoRNA 1,753 0,826

ENSG00000070404 FSTL3 follistatin-like 3 (secreted glycoprotein) protein coding 1,747 0,887

ENSG00000213949 ITGA1 integrin, alpha 1 protein coding 1,728 0,926

ENSG00000201998 SNORA23 small nucleolar RNA, H/ACA box 23 snoRNA 1,707 0,907

ENSG00000166432 ZMAT1 zinc finger, matrin-type 1 protein coding 1,676 0,858

ENSG00000075213 SEMA3A sema domain, immunoglobulin domain (Ig), short

basic domain, secreted, (semaphorin) 3A protein coding 1,672 0,849

ENSG00000118473 SGIP1 SH3-domain GRB2-like (endophilin) interacting

protein 1 protein coding 1,656 0,912

ENSG00000136048 DRAM1 DNA-damage regulated autophagy modulator 1 protein coding 1,616 0,838

ENSG00000198121 LPAR1 lysophosphatidic acid receptor 1 protein coding 1,606 0,863

ENSG00000078114 NEBL nebulette protein coding 1,578 0,865

ENSG00000165029 ABCA1 ATP-binding cassette, sub-family A (ABC1), member

1 protein coding 1,561 0,840

ENSG00000121039 RDH10 retinol dehydrogenase 10 (all-trans) protein coding 1,560 0,858

ENSG00000200156 RNU5B-1 RNA, U5B small nuclear 1 snRNA 1,555 0,853

ENSG00000196581 AJAP1 adherens junctions associated protein 1 protein coding 1,551 0,803

ENSG00000173281 PPP1R3B protein phosphatase 1, regulatory subunit 3B protein coding 1,541 0,861

ENSG00000165169 DYNLT3 dynein, light chain, Tctex-type 3 protein coding 1,525 0,809

ENSG00000027075 PRKCH protein kinase C, eta protein coding 1,495 0,854

ENSG00000137558 PI15 peptidase inhibitor 15 protein coding 1,492 0,857

ENSG00000171951 SCG2 secretogranin II protein coding 1,477 0,864

ENSG00000162692 VCAM1 vascular cell adhesion molecule 1 protein coding 1,457 0,848

ENSG00000128923 FAM63B family with sequence similarity 63, member B protein coding 1,453 0,858

ENSG00000138735 PDE5A phosphodiesterase 5A, cGMP-specific protein coding 1,449 0,860

ENSG00000011465 DCN decorin protein coding 1,444 0,832

ENSG00000146469 VIP vasoactive intestinal peptide protein coding 1,429 0,859

ENSG00000240583 AQP1 aquaporin 1 protein coding 1,397 0,822

ENSG00000166833 NAV2 neuron navigator 2 protein coding 1,395 0,856

ENSG00000148700 ADD3 adducin 3 (gamma) protein coding 1,383 0,859

ENSG00000079689 SCGN secretagogin, EF-hand calcium binding protein

[Source:HGNC Symbol;Acc:16941] protein coding 1,371 0,828

ENSG00000255433 AP000479.1 lincRNA 1,365 0,809

ENSG00000186469 GNG2 guanine nucleotide binding protein (G protein), gamma 2

protein coding 1,364 0,859

ENSG00000080200 CRYBG3 beta-gamma crystallin domain containing 3 protein coding 1,357 0,825

ENSG00000118276 B4GALT6 UDP-Gal:betaGlcNAc beta 1,4-

galactosyltransferase, polypeptide 6 protein coding 1,344 0,819

ENSG00000259834 RP11-284N8.3 lincRNA 1,342 0,805

ENSG00000019549 SNAI2 snail family zinc finger 2 protein coding 1,341 0,814

ENSG00000088756 ARHGAP28 Rho GTPase activating protein 28 protein coding 1,333 0,816

ENSG00000179941 BBS10 Bardet-Biedl syndrome 10 protein coding 1,328 0,814

ENSG00000163661 PTX3 pentraxin 3, long protein coding 1,318 0,809

ENSG00000163364 AC017048.3 lincRNA 1,313 0,811

ENSG00000202354 RNY3 RNA, Ro-associated Y3 misc RNA 1,299 0,814

ENSG00000179915 NRXN1 neurexin 1 protein coding 1,273 0,817

ENSG00000023445 BIRC3 baculoviral IAP repeat containing 3 protein coding 1,264 0,814

ENSG00000101871 MID1 midline 1 (Opitz/BBB syndrome) protein coding 1,264 0,800

Page 58: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

46

ENSG00000165240 ATP7A ATPase, Cu++ transporting, alpha polypeptide protein coding 1,259 0,822

ENSG00000109046 WSB1 WD repeat and SOCS box containing 1 protein coding 1,248 0,820

ENSG00000104427 ZC2HC1A zinc finger, C2HC-type containing 1A protein coding 1,245 0,815

ENSG00000143850 PLEKHA6 pleckstrin homology domain containing, family A member 6

protein coding 1,223 0,806

ENSG00000180998 GPR137C G protein-coupled receptor 137C protein coding 1,207 0,805

ENSG00000145685 LHFPL2 lipoma HMGIC fusion partner-like 2 protein coding 1,194 0,812

ENSG00000136603 SKIL SKI-like oncogene protein coding 1,194 0,813

ENSG00000111912 NCOA7 nuclear receptor coactivator 7 protein coding 1,186 0,812

ENSG00000269028 MTRNR2L12 MT-RNR2-like 12 (pseudogene) protein coding 1,172 0,809

ENSG00000203667 COX20 COX20 cytochrome C oxidase assembly factor protein coding 1,142 0,803

ENSG00000134352 IL6ST interleukin 6 signal transducer (gp130, oncostatin M

receptor) protein coding 1,142 0,809

ENSG00000166471 TMEM41B transmembrane protein 41B protein coding 1,142 0,805

ENSG00000178662 CSRNP3 cysteine-serine-rich nuclear protein 3 protein coding 1,138 0,809

ENSG00000144366 GULP1 GULP, engulfment adaptor PTB domain containing 1 protein coding 1,124 0,806

ENSG00000128609 NDUFA5 NADH dehydrogenase (ubiquinone) 1 alpha subcomplex, 5

protein coding 1,108 0,801

ENSG00000005249 PRKAR2B protein kinase, cAMP-dependent, regulatory, type II, beta

protein coding 1,085 0,805

ENSG00000196482 ESRRG estrogen-related receptor gamma protein coding 1,085 0,804

ENSG00000234456 MAGI2-AS3 MAGI2 antisense RNA 3 processed transcript

1,070 0,802

ENSG00000091039 OSBPL8 oxysterol binding protein-like 8 protein coding 1,068 0,803

Page 59: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

47

Tabla 6. 32 genes infraexpresados tras 24 horas de tratamiento con RA, respecto al Control 1 (0 horas).

Gene ID Gene Name Description Biotype M prob

ENSG00000054803 CBLN4 cerebellin 4 precursor protein coding -4,051 0,854

ENSG00000165973 NELL1 NEL-like 1 (chicken) protein coding -2,806 0,951

ENSG00000182022 CHST15

carbohydrate (N-acetylgalactosamine 4-sulfate 6-O)

sulfotransferase 15 protein coding -2,455 0,909

ENSG00000128594 LRRC4 leucine rich repeat containing 4 protein coding -2,436 0,900

ENSG00000196562 SULF2 sulfatase 2 protein coding -2,168 0,856

ENSG00000156564 LRFN2

leucine rich repeat and fibronectin type III domain

containing 2 protein coding -2,157 0,834

ENSG00000182771 GRID1 glutamate receptor, ionotropic, delta 1 protein coding -1,969 0,857

ENSG00000174672 BRSK2 BR serine/threonine kinase 2 protein coding -1,953 0,817

ENSG00000136997 MYC v-myc avian myelocytomatosis viral oncogene homolog protein coding -1,841 0,888

ENSG00000065057 NTHL1 nth endonuclease III-like 1 (E. coli) protein coding -1,832 0,852

ENSG00000221514 SNORD111B small nucleolar RNA, C/D box 111B snoRNA -1,772 0,832

ENSG00000254656 RTL1 retrotransposon-like 1 protein coding -1,655 0,899

ENSG00000227309 AC140076.1 pseudogene -1,494 0,863

ENSG00000170396 ZNF804A zinc finger protein 804A protein coding -1,480 0,829

ENSG00000121966 CXCR4 chemokine (C-X-C motif) receptor 4 protein coding -1,469 0,860

ENSG00000231531 HINT1P1 histidine triad nucleotide binding protein 1 pseudogene 1 pseudogene -1,465 0,805

ENSG00000188976 NOC2L nucleolar complex associated 2 homolog (S. cerevisiae) protein coding -1,439 0,850

ENSG00000179603 GRM8 glutamate receptor, metabotropic 8 protein coding -1,433 0,855

ENSG00000162407 PPAP2B phosphatidic acid phosphatase type 2B protein coding -1,411 0,847

ENSG00000196890 HIST3H2BB histone cluster 3, H2bb protein coding -1,403 0,813

ENSG00000168348 INSM2 insulinoma-associated 2 protein coding -1,398 0,841

ENSG00000123395 C12orf44 chromosome 12 open reading frame 44 protein coding -1,383 0,816

ENSG00000105676 ARMC6 armadillo repeat containing 6 protein coding -1,339 0,811

ENSG00000143537 ADAM15 ADAM metallopeptidase domain 15 protein coding -1,338 0,839

ENSG00000182199 SHMT2 serine hydroxymethyltransferase 2 (mitochondrial) protein coding -1,336 0,844

ENSG00000265145 SNORD53 small nucleolar RNA, C/D box 53 snoRNA -1,299 0,822

ENSG00000107874 CUEDC2 CUE domain containing 2 protein coding -1,246 0,808

ENSG00000183207 RUVBL2 RuvB-like AAA ATPase 2 protein coding -1,229 0,808

ENSG00000123454 DBH

dopamine beta-hydroxylase (dopamine beta-

monooxygenase) protein coding -1,217 0,810

ENSG00000125170 DOK4 docking protein 4 protein coding -1,095 0,803

ENSG00000078549 ADCYAP1R1 adenylate cyclase activating polypeptide 1 (pituitary) receptor type I protein coding -1,094 0,803

ENSG00000172572 PDE3A phosphodiesterase 3A, cGMP-inhibited protein coding -1,089 0,804

Page 60: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

48

Tabla 7. 93 genes infraexpresados tras 48 horas de tratamiento con RA, respecto al Control 1 (0 horas).

Gene ID Gene Name Description Biotype M prob

ENSG00000003137 CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1 protein coding 10,237 0,982

ENSG00000095596 CYP26A1

cytochrome P450, family 26, subfamily A,

polypeptide 1 protein coding 8,010 0,993

ENSG00000162496 DHRS3

dehydrogenase/reductase (SDR family)

member 3 protein coding 6,695 0,999

ENSG00000196167 COLCA1 colorectal cancer associated 1 protein coding 5,545 0,892

ENSG00000163331 DAPL1 death associated protein-like 1 protein coding 5,375 0,941

ENSG00000198732 SMOC1

SPARC related modular calcium binding

1 protein coding 4,361 0,892

ENSG00000148053 NTRK2

neurotrophic tyrosine kinase, receptor,

type 2 protein coding 4,190 0,998

ENSG00000136960 ENPP2

ectonucleotide

pyrophosphatase/phosphodiesterase 2 protein coding 3,919 0,959

ENSG00000154654 NCAM2 neural cell adhesion molecule 2 protein coding 3,876 0,997

ENSG00000074966 TXK TXK tyrosine kinase protein coding 3,859 0,889

ENSG00000111341 MGP matrix Gla protein protein coding 3,824 0,989

ENSG00000183287 CCBE1

collagen and calcium binding EGF

domains 1 protein coding 3,179 0,970

ENSG00000155011 DKK2

dickkopf WNT signaling pathway inhibitor

2 protein coding 3,155 0,986

ENSG00000143320 CRABP2 cellular retinoic acid binding protein 2 protein coding 3,002 0,965

ENSG00000116183 PAPPA2 pappalysin 2 protein coding 2,999 0,928

ENSG00000198959 TGM2 transglutaminase 2 protein coding 2,994 0,969

ENSG00000152931 PART1 prostate androgen-regulated transcript 1 (non-protein coding) lincRNA 2,933 0,833

ENSG00000135914 HTR2B

5-hydroxytryptamine (serotonin) receptor

2B, G protein-coupled protein coding 2,876 0,908

ENSG00000081923 ATP8B1

ATPase, aminophospholipid transporter,

class I, type 8B, member 1 protein coding 2,870 0,893

ENSG00000066382 MPPED2

metallophosphoesterase domain

containing 2 protein coding 2,817 0,976

ENSG00000166510 CCDC68 coiled-coil domain containing 68 protein coding 2,748 0,937

ENSG00000150672 DLG2 discs, large homolog 2 (Drosophila) protein coding 2,748 0,969

ENSG00000077092 RARB retinoic acid receptor, beta protein coding 2,734 0,979

ENSG00000106034 CPED1

cadherin-like and PC-esterase domain

containing 1 protein coding 2,665 0,954

ENSG00000238835 SCARNA18 small Cajal body-specific RNA 18 snoRNA 2,583 0,886

ENSG00000169429 IL8 interleukin 8 protein coding 2,579 0,862

ENSG00000106484 MEST mesoderm specific transcript protein coding 2,453 0,946

ENSG00000148677 ANKRD1 ankyrin repeat domain 1 (cardiac muscle) protein coding 2,442 0,922

ENSG00000145012 LPP

LIM domain containing preferred

translocation partner in lipoma protein coding 2,373 0,804

ENSG00000136371 MTHFS

5,10-methenyltetrahydrofolate synthetase

(5-formyltetrahydrofolate cyclo-ligase) protein coding 2,355 0,837

ENSG00000078098 FAP fibroblast activation protein, alpha protein coding 2,342 0,819

ENSG00000145632 PLK2 polo-like kinase 2 protein coding 2,213 0,935

ENSG00000165731 RET ret proto-oncogene protein coding 2,205 0,942

ENSG00000128510 CPA4 carboxypeptidase A4 protein coding 2,188 0,916

ENSG00000123700 KCNJ2

potassium inwardly-rectifying channel,

subfamily J, member 2 protein coding 2,120 0,857

ENSG00000207392 SNORA20 small nucleolar RNA, H/ACA box 20 snoRNA 2,105 0,885

ENSG00000104626 ERI1 exoribonuclease 1 protein coding 2,104 0,939

ENSG00000260391 RP11-71H17.7 sense overlapping 2,066 0,870

ENSG00000122641 INHBA inhibin, beta A protein coding 2,063 0,925

ENSG00000111339 ART4 ADP-ribosyltransferase 4 protein coding 2,044 0,837

ENSG00000064692 SNCAIP synuclein, alpha interacting protein protein coding 2,010 0,844

ENSG00000150938 CRIM1 cysteine rich transmembrane BMP regulator 1 (chordin-like) protein coding 2,000 0,874

ENSG00000112769 LAMA4 laminin, alpha 4 protein coding 1,991 0,931

ENSG00000259865 RP11-488L18.10 lincRNA 1,950 0,890

ENSG00000070404 FSTL3 follistatin-like 3 (secreted glycoprotein) protein coding 1,939 0,903

ENSG00000234944 RP11-124O11.1 lincRNA 1,926 0,851

ENSG00000151892 GFRA1 GDNF family receptor alpha 1 protein coding 1,926 0,881

ENSG00000163293 NIPAL1 NIPA-like domain containing 1 protein coding 1,922 0,840

Page 61: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

49

ENSG00000174600 CMKLR1 chemokine-like receptor 1 protein coding 1,885 0,845

ENSG00000054598 FOXC1 forkhead box C1 protein coding 1,863 0,908

ENSG00000196581 AJAP1 adherens junctions associated protein 1 protein coding 1,847 0,871

ENSG00000125398 SOX9 SRY (sex determining region Y)-box 9 protein coding 1,842 0,815

ENSG00000175879 HOXD8 homeobox D8 protein coding 1,839 0,918

ENSG00000230630 DNM3OS DNM3 opposite strand/antisense RNA antisense 1,831 0,808

ENSG00000188133 TMEM215 transmembrane protein 215 protein coding 1,822 0,861

ENSG00000164125 FAM198B family with sequence similarity 198, member B protein coding 1,796 0,869

ENSG00000168405 CMAHP

cytidine monophospho-N-acetylneuraminic acid hydroxylase,

pseudogene pseudogene 1,725 0,822

ENSG00000121440 PDZRN3 PDZ domain containing ring finger 3 protein coding 1,677 0,847

ENSG00000250588 IQCJ-SCHIP1 IQCJ-SCHIP1 readthrough protein coding 1,674 0,826

ENSG00000164616 FBXL21

F-box and leucine-rich repeat protein 21

(gene/pseudogene) polymorphic pseudogene 1,657 0,806

ENSG00000213949 ITGA1 integrin, alpha 1 protein coding 1,651 0,858

ENSG00000118473 SGIP1

SH3-domain GRB2-like (endophilin)

interacting protein 1 protein coding 1,621 0,843

ENSG00000136048 DRAM1

DNA-damage regulated autophagy

modulator 1 protein coding 1,564 0,820

ENSG00000173281 PPP1R3B

protein phosphatase 1, regulatory subunit

3B protein coding 1,549 0,850

ENSG00000171951 SCG2 secretogranin II protein coding 1,516 0,855

ENSG00000078114 NEBL nebulette protein coding 1,514 0,852

ENSG00000165029 ABCA1

ATP-binding cassette, sub-family A

(ABC1), member 1 protein coding 1,512 0,823

ENSG00000198121 LPAR1 lysophosphatidic acid receptor 1 protein coding 1,495 0,846

ENSG00000137558 PI15 peptidase inhibitor 15 protein coding 1,494 0,845

ENSG00000200156 RNU5B-1 RNA, U5B small nuclear 1 snRNA 1,488 0,836

ENSG00000121039 RDH10 retinol dehydrogenase 10 (all-trans) protein coding 1,477 0,841

ENSG00000146469 VIP vasoactive intestinal peptide protein coding 1,450 0,849

ENSG00000202354 RNY3 RNA, Ro-associated Y3 misc RNA 1,440 0,845

ENSG00000163661 PTX3 pentraxin 3, long protein coding 1,429 0,840

ENSG00000128923 FAM63B

family with sequence similarity 63,

member B protein coding 1,404 0,844

ENSG00000121297 TSHZ3 teashirt zinc finger homeobox 3 protein coding 1,396 0,801

ENSG00000138735 PDE5A phosphodiesterase 5A, cGMP-specific protein coding 1,382 0,845

ENSG00000027075 PRKCH protein kinase C, eta protein coding 1,380 0,835

ENSG00000116741 RGS2 regulator of G-protein signaling 2, 24kDa protein coding 1,378 0,820

ENSG00000011465 DCN decorin protein coding 1,376 0,811

ENSG00000186469 GNG2

guanine nucleotide binding protein (G

protein), gamma 2 protein coding 1,366 0,849

ENSG00000240583 AQP1 aquaporin 1 protein coding 1,358 0,804

ENSG00000166833 NAV2 neuron navigator 2 protein coding 1,351 0,844

ENSG00000118276 B4GALT6

UDP-Gal:betaGlcNAc beta 1,4-

galactosyltransferase, polypeptide 6 protein coding 1,347 0,805

ENSG00000088756 ARHGAP28 Rho GTPase activating protein 28 protein coding 1,341 0,841

ENSG00000079689 SCGN secretagogin, EF-hand calcium binding protein protein coding 1,338 0,812

ENSG00000162692 VCAM1 vascular cell adhesion molecule 1 protein coding 1,337 0,828

ENSG00000148700 ADD3 adducin 3 (gamma) protein coding 1,321 0,814

ENSG00000143850 PLEKHA6

pleckstrin homology domain containing,

family A member 6 protein coding 1,261 0,803

ENSG00000245532 NEAT1

nuclear paraspeckle assembly transcript

1 (non-protein coding) lincRNA 1,256 0,812

ENSG00000145685 LHFPL2 lipoma HMGIC fusion partner-like 2 protein coding 1,251 0,811

ENSG00000165240 ATP7A ATPase, Cu++ transporting, alpha polypeptide protein coding 1,248 0,812

ENSG00000136603 SKIL SKI-like oncogene protein coding 1,214 0,802

Page 62: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

50

Tabla 8. 23 genes infraexpresados tras 48 horas de tratamiento con RA, respecto al Control 1 (0 horas).

Gene ID Gene Name Description Biotype M prob

ENSG00000054803 CBLN4 cerebellin 4 precursor protein coding -4,459 0,849

ENSG00000258907 RP11-644F5.15 pseudogene -3,212 0,849

ENSG00000182022 CHST15

carbohydrate (N-acetylgalactosamine 4-sulfate 6-O)

sulfotransferase 15 protein coding -3,137 0,933

ENSG00000165973 NELL1 NEL-like 1 (chicken) protein coding -2,779 0,944

ENSG00000128594 LRRC4 leucine rich repeat containing 4 protein coding -2,451 0,890

ENSG00000259465 AHCYP7 adenosylhomocysteinase pseudogene 7 pseudogene -2,349 0,809

ENSG00000182771 GRID1 glutamate receptor, ionotropic, delta 1 protein coding -2,283 0,863

ENSG00000196562 SULF2 sulfatase 2 protein coding -2,037 0,839

ENSG00000156564 LRFN2 leucine rich repeat and fibronectin type III domain containing 2 protein coding

-1,928 0,809

ENSG00000231531 HINT1P1 histidine triad nucleotide binding protein 1 pseudogene 1 pseudogene

-1,870 0,865

ENSG00000136997 MYC v-myc avian myelocytomatosis viral oncogene homolog protein coding

-1,823 0,876

ENSG00000065057 NTHL1 nth endonuclease III-like 1 (E. coli) protein coding -1,817 0,840

ENSG00000143473 KCNH1

potassium voltage-gated channel, subfamily H (eag-

related), member 1 protein coding -1,774 0,842

ENSG00000108270 AATF apoptosis antagonizing transcription factor protein coding -1,703 0,850

ENSG00000170396 ZNF804A zinc finger protein 804A protein coding -1,696 0,882

ENSG00000121966 CXCR4 chemokine (C-X-C motif) receptor 4 protein coding -1,644 0,853

ENSG00000227309 AC140076.1 pseudogene -1,631 0,856

ENSG00000265145 SNORD53 small nucleolar RNA, C/D box 53 snoRNA -1,581 0,857

ENSG00000254656 RTL1 retrotransposon-like 1 protein coding -1,554 0,826

ENSG00000179603 GRM8 glutamate receptor, metabotropic 8 protein coding -1,352 0,839

ENSG00000229091 HSPA8P8 heat shock 70kDa protein 8 pseudogene 8 pseudogene -1,347 0,806

ENSG00000172572 PDE3A phosphodiesterase 3A, cGMP-inhibited protein coding -1,225 0,803

ENSG00000078549 ADCYAP1R1

adenylate cyclase activating polypeptide 1 (pituitary)

receptor type I protein coding -1,188 0,800

Page 63: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

51

4.6 Análisis de enriquecimiento de términos GO

Se realiza este análisis con el fin de conocer cuáles son los genes relevantes en el

metabolismo del ácido retinoico y en la diferenciación celular en el contexto del

neuroblastoma, entender cómo actuán y en qué rutas biológicas participan.

En las tablas 9, 10 y 11 se muestran la clasificación de los genes en términos GO

sobreexpresados con tratamiento de RA durante 24 horas, infraexpresados con

tratamiento RA durante 24 horas y sobreexpresados con tratamiento de RA durante 48

horas, respectivamente. En este análisis no se han encontrado rutas biológicas

infraexpresadas en el tratamiento de RA durante 48 horas. En cada tabla, aquellos

términos GO más relevantes en el contexto de neuroblastoma y diferenciación neuronal

se han marcado con un asterísco (*).

A continuación se detallará información de los genes sobre e infraexpresados en cada

condición, extraída de la página web GeneCards (www.genecards.org).

4.6.1 Procesos infrarregulados durante 24 horas de tratamiento con RA

Los genes infraexpresados a las 24 horas de tratamiento con RA más significativos en

el contexto de cáncer son los implicados en procesos de migración, uniones célula-

célula o célula-matriz extracelular y con actividades catalíticas.

La señalización mediada por cAMP parece estar infrarregulada, con la infraexpresión

del gen PDE3A (cyclic GMP-inhibited phosphodiesterase A), a pesar de que defectos

en esta ruta se asocia a carcinogénesis en células murinas de neuroblastoma [31, 32].

En cuanto al proceso de migración, el gen PPAP2B (phosphatidic acid phosphatase

type 2B) está relacionado con el metabolismo del ácido fosfatídico (PA). Se ha descrito

un aumento de PA y derivados de su metabolismo en varios tipos de cáncer; como el

pulmonar, de próstata, de ovario y cerebral [33].

Respecto a las uniones células-célula o célula-matriz extracelular aparecen varios genes

infraexpresados; como el gen LRRC4 (Leucine-rich repeat C4), que codifica para una

proteína de adhesión sináptica, y se ha asociado con la supresión tumoral en cáncer

cerebral [34]; el gen CHRM2 (cholinergic receptor, muscarinic 2), que codifica para el

receptor muscarínico de acetilcolina e interviene en la inhibición de la adenilato ciclasa,

la descomposición de fosfoinositoides, modulación de los canales de potasio a través de

proteínas G, además de estar implicado en la excitabilidad neuronal, la plasticidad

sináptica y la regulación de la liberación de acetilcolina [35]; el gen CBLN4 codifica

para la cerebelina 4 y está relacionado con la formación de sinapsis en varias zonas

cerebrales [36]; el gen GAP43 (growth associated protein 43) es un marcador del

sistema nervioso periférico embrionario [37]; el gen GRIN1 (glutamate receptor,

ionotropic, N-methyl D-aspartate 1) codifica para un subtipo del receptor de glutamato

NMDA implicado en la plasticidad sináptica y se asocia a células indiferenciadas [38].

Otro proceso infrarregulado es la actividad catalítica, estando implicados los genes

PPAP2B, PDE3A y SULF2 (sulfatase 2). Este último está implicado en el

procesamiento de los proteoglicanos y elevados niveles de SULF2 se asocian a cáncer

cerebral [39].

Page 64: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

52

En la infrarregulación con el tratamiento de RA durante 24 horas aparecen genes

relacionados con procesos tumorales y con diferenciación neuronal, a pesar de que se

esperaría que el principal proceso infrarregulado fuera el tumoral, incluyéndose la

proliferación y migración.

4.6.2 Procesos sobrerregulados durante 24 horas de tratamiento con RA

Entre los procesos sobrerregulados sólo en el tratamiento con RA durante 24 horas

destaca la regulación positiva del proceso apoptótico, en el que participan los genes

RARB, TGM2 (transgultaminase 2, inducido por RA, se ha descrito que puede tener

funciones apoptóticas o de supervivencia [40]), y LPAR1 (lysophosphatidic acid

receptor 1), ciertos estudios afirman que disminuye la motilidad y la invasión en células

de neuroblastoma murinas [41]).

Encontramos además desarrollo de la dendrita, en el que participan los genes NTKR2

(codifica para el receptor trkB y cuando se une a su ligando BDNF, brain-derived

neurotrophic factor, activa las rutas Ras-Raf-MEK y las cascadas de señalización que

conducen a la neurotransmisión glutamatérgica y liberación de neurotransmisores [42,

43, 44]) y PLK2 (polo-like kinase 2, se sobrerregula cuando hay una actividad sináptica

elevada, y se encuentra presente en células post-mitóticas y ausente en células

proliferativas [45]).

4.6.3 Procesos sobrerregulados comunes durante 24 y 48 horas de tratamiento con

RA

En el tratamiento con RA durante 24 y 48 horas aparecen sobrerregulados los genes

implicados en el metabolismo RA y su señalización, así como los implicados en la

diferenciación neuronal.

En cuanto al metabolismo del RA aparecen los genes CYP26A1, CYP26B1, CRABP2;

además de los genes DHRS3 y RDH10 implicados en el metabolismo del retinol. Esto

último resulta llamativo. Puesto que el compuesto que se añade a las células es el all-

trans retinoic acid, se esperaría únicamente la aparición de los citocromos que

metabolizan el RA llevándolo a la degradación y eliminación, y no de enzimas Rdh10 y

Dhrs3 que actúan a nivel del retinol y retinal y que son precursores del all-trans retinoic

acid (figura 25).

Por tanto, sería necesario dilucidar cuáles son las enzimas responsables de convertir el

ácido retinoico todo-trans en sus precursores.

Respecto a la señalización por RA, el gen RARB aparece como siginificativo, lo cual es

consistente con el mecanismo clásico de acción de RA (apartado 1).

Page 65: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

53

En la respuesta celular al RA también intervienen los genes SOX9 (SRY (sex

deterimining Y)-box 9, cuando es inducido por RA inhibe la proliferación celular por

activación de HES1 (hairy and enhancer of split 1, (Drosophila)) en cáncer de mama

[46, 47]), el receptor tirosina quinasa RET y AQP1 (aquaporin 1, implicado en el

transporte de fluido, se expresa en cultivos celulares del epitelio pigmentario de la retina

inducido por RA [48]).

Además, ciertas rutas relacionadas con la diferenciación neuronal se encuentran

sobreexpresadas tanto en 24 como en 48 horas de tratamiento con RA, tales como

diferenciación celular, desarrollo del sistema nervioso, desarrollo de la cresta neural,

regulación positiva del desarrollo de la proyección de neuronas, desarrollo de la espina

dendrítica y regulación de la secreción de neurotransmisores.

En la diferenciación celular aparecen los genes SMOC1 (SPARC related modular

calcium binding, implicado en ciertos tipos de tumores cerebrales como el

oligodendroglioma [49], pero también se ha descrito que participa en el desarollo ocular

y límbico [50]), MGP (matrix Gla protein, implicado en la migración de varios tipos

tumorales [51]), DAPL1 (death associated protein-like 1, interviene en procesos de

apoptosis [52]), SOX9 (especificador de progrenitores de la cresta neural y de sus

derivados diferenciados [46]) y BHLHE41 (basic helix-loop-helix family, member 3 41;

no se ha encontrado información en el contexto de diferenciación celular o neurona,

pero ciertos estudios afirman que la familia BHLH está relacionada con la

diferenciación de ciertos tipos celulares, incluyendo la especificación de neuronas [53,

54, 55]).

En el desarrollo del sistema nervioso están implicados los genes RET (marcador

diferenciación en células tumorales neuroblásticas [56]), MPPED2

(metallophosphoesterase domain containing 2, inhibe la proliferación celular y reduce

la agresividad del tumor [57]), INHBA (inhibin, beta A; implicado en diversas

funciones neuronales [58]), HES1 (diana de la vía de señalización Notch; interviene en

Ésteres

de retinol

β-caroteno

Pro-vitamina A

Todo-trans-retinol

Todo-trans-retinal

Ácido retinoico todo-trans

Metabolitos del ácido retinoico: 4-oxo-RA,

4-hydroxi-RA, 18-hydroxi-RA

Ester

hidrolasa

LRAT

RDHs

DHRS3

ADH5

ALDHs ? CYP26A1

CYP26B1

Figura 25 Síntesis y degradación de RA. Las RDHs (RDH10) convierten el todo-trans-retinol en todo-trans-retinal,

mientras que DHRS3 participa en el proceso inverso, convirtiendo el todo-trans-retinal en todo-trans-retinol. Si realmente hay una conversión del RA hacia sus precursores, se requeriría una enzima que convirtiera el ácido

retinoico todo-trans en todo-trans-retinal.

Page 66: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

54

la reducción de la proliferación y en la muerte de células tumorales [59]), NAV2

(neuron navigator 2, implicado en la extensión de las neuritas [60]) y MAB21L2 (mab-

21-like 2 (C. elegans), participa en el desarrollo del ojo, mesencéfalo, tubo neural y

arcos branquiales en zebrafish y ratón [61,62]).

En el desarrollo de la cresta neural también se expresan los genes CYP26A1, RDH10 y

FOXC1 (forkhead box C1, implicado en el desarrollo del prosencéfalo [63]).

En la regulación positiva del desarrollo de la proyección de neuronas intervienen los

genes NTRK2 y RET. Además, en el desarrollo de la espina dendrítica estarían

implicados LPAR1, y de nuevo, NTRK2.

En la regulación de la secreción de neurotransmisores está implicado el gen NTRK2

tanto en 24 como en 48 horas de tratamiento con RA.

4.6.4 Procesos sobrerregulados durante 48 horas de tratamiento con RA

Tras 48 horas de tratamiento con RA, destacan los procesos típicos de una neurona en

plena diferenciación, como el proceso metabólico de la dopamina, en el que participa el

gen NTRK2; la potenciación sináptica a largo plazo, en la que participan los genes

NTRK2, PLK2 y EGR1 (early growth response 1; implicado en la transmisión

sináptica, la plasticidad, aprendizaje y memoria a largo plazo [64]), y la cascada de

señalización ERK1/ERK2 (implicada en la neurotransmisión glutamatérgica y

liberación de neurotransmisores [65]) en la que participan los genes SOX9 y CTSH

(codifica para captesina H, una aminopeptidasa implicada en la biosíntesis de

neuropéptidos [66]).

Tras la clasificación de los genes diferencialmente expresados durante el tratamiento de

RA durante 24 y 48 horas, cabe destacar que en muchos de los genes detallados en este

apartado no se ha descrito implicación en el contexto de neuroblastoma o

diferenciación neuronal inducida por RA, por lo que se han intentado englobar en un

contexto tumoral, especialmente en el cerebral. Además, se sabe que genes implicados

en procesos de proliferación e invasión en un tipo tumoral determinado tienen una

función diferente en otro tejido o tipo tumoral distinto. Por tanto, sería necesario

realizar más estudios para esclarecer la función de estos genes en neuroblastoma y su

papel en la diferenciación neuronal inducida por RA.

Page 67: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

55

Tabla 9. Clasificación en categorías GO de los genes sobreexpresados tras 24 horas de tratamiento con RA.

GO.Term.Name adj.pvalue Gene.Name Description M

GO:0008284 positive regulation of cell proliferation 5.69e-05 NTRK2

neurotrophic tyrosine kinase, receptor, type 2

4,886

SOX9

SRY (sex determining region Y)-box 9

2,041

HES1

hairy and enhancer of split 1, (Drosophila)

1,830

MAB21L2 mab-21-like 2 (C. elegans) 6,134

GO:0007186 G-protein coupled receptor signaling pathway 0,002 RGS13

regulator of G-protein signaling 13

8,510

DAPL1 death associated protein-like 1 4,892

PTGIR

prostaglandin I2 (prostacyclin)

receptor (IP) 2,511

LPAR1

lysophosphatidic acid receptor

1 1,775

GPR146

G protein-coupled receptor

146 2,852

GO:0007165 signal transduction 0,002 RET ret proto-oncogene 3,505

SMOC1

SPARC related modular

calcium binding 1 4,488

CRABP2

cellular retinoic acid binding protein 2

3,185

RARB retinoic acid receptor, beta 3,115

SOX9

SRY (sex determining region

Y)-box 9 2,041

PDE4C

phosphodiesterase 4C, cAMP-

specific 1,670

PRKCH protein kinase C, eta 1,455

*GO:0007399 nervous system development 0,003 RET ret proto-oncogene 3,505

MPPED2

metallophosphoesterase

domain containing 2 3,240

INHBA inhibin, beta A 1,893

HES1

hairy and enhancer of split 1,

(Drosophila) 1,830

C4orf6

chromosome 4 open reading

frame 6 7,483

NAV2 neuron navigator 2 1,449

MAB21L2 mab-21-like 2 (C. elegans) 6,134

*GO:0030154 cell differentiation 0,004 SMOC1

SPARC related modular

calcium binding 1 4,488

MGP matrix Gla protein 3,884

DAPL1 death associated protein-like 1 4,892

SOX9

SRY (sex determining region

Y)-box 9 2,041

INHBA inhibin, beta A 1,893

BHLHE41

basic helix-loop-helix family, member e41

7,429

*GO:0030425 dendrite 0,013 NTRK2

neurotrophic tyrosine kinase,

receptor, type 2 4,886

PLK2 polo-like kinase 2 2,068

GO:0043565 sequence-specific DNA

binding 0,016 RARB retinoic acid receptor, beta 3,115

EGR1 early growth response 1 3,860

HOXD8 homeobox D8 1,871

FOXC1 forkhead box C1 1,860

SOX9

SRY (sex determining region Y)-box 9

2,041

CEBPD

CCAAT/enhancer binding protein (C/EBP), delta

1,916

HIC1 hypermethylated in cancer 1 2,566

HES1

hairy and enhancer of split 1,

(Drosophila) 1,830

GO:0006468 protein phosphorylation 0,016 NTRK2

neurotrophic tyrosine kinase, receptor, type 2

4,886

RET ret proto-oncogene 3,505

Page 68: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

56

PLK2 polo-like kinase 2 2,068

SOX9

SRY (sex determining region

Y)-box 9 2,041

LAMA4 laminin, alpha 4 2,206

PRKCH protein kinase C, eta 1,455

GO:0007155 cell adhesion 0,018 NCAM2

neural cell adhesion molecule 2

2,390

ITGA1 integrin, alpha 1 1,981

LAMA4 laminin, alpha 4 2,206

AJAP1

adherens junctions associated protein 1

1,762

HES1

hairy and enhancer of split 1, (Drosophila)

1,830

ICAM1

intercellular adhesion molecule 1

1,450

GO:0007158 neuron cell-cell adhesion 0,018 RET ret proto-oncogene 3,505

NCAM2

neural cell adhesion molecule 2

2,390

*GO:0043065 positive regulation of apoptotic

process 0,028 RARB RARB 3,115

TGM2 TGM2 2,964

LPAR1 LPAR1 1,775

GO:0035556 intracellular signal transduction 0,033 PRKCH protein kinase C, eta 1,455

GO:0030155 regulation of cell adhesion 0.034 RET ret proto-oncogene 3,505

SOX9

SRY (sex determining region Y)-box 9

2,041

LAMA4 laminin, alpha 4 2,206

ICAM1

intercellular adhesion molecule

1 1,450

*GO:0010976 positive regulation of neuron projection development 0,035 NTRK2

neurotrophic tyrosine kinase, receptor, type 2

4,886

RET ret proto-oncogene 3,505

GO:0043025 neuronal cell body 0,035 NTRK2

neurotrophic tyrosine kinase, receptor, type 2

4,886

*GO:0043197 dendritic spine 0,035 NTRK2

neurotrophic tyrosine kinase,

receptor, type 2 4,886

LPAR1

lysophosphatidic acid receptor

1 1,775

GO:0043123 positive regulation of I-kappaB kinase/NF-kappaB cascade 0,037 TGM2 Transglutaminase 2

2,964

PLK2 polo-like kinase 2 2,068

LPAR1

lysophosphatidic acid receptor

1 1,775

GO:0071356 cellular response to tumor necrosis factor 0,037 ICAM1

intercellular adhesion molecule 1

1,450

*GO:0071300 cellular response to retinoic

acid 0,057 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,256

CYP26A1

cytochrome P450, family 26,

subfamily A, polypeptide 1 8,348

RET ret proto-oncogene 3,505

SOX9

SRY (sex determining region

Y)-box 9 2,041

AQP1 aquaporin 1 1,642

*GO:0014032 neural crest cell development 0,070 CYP26A1

cytochrome P450, family 26, subfamily A, polypeptide 1

8,348

FOXC1 forkhead box C1 1,860

SOX9

SRY (sex determining region

Y)-box 9 2,041

RDH10

retinol dehydrogenase 10 (all-trans)

1,529

*GO:0051968 positive regulation of synaptic

transmission, glutamatergic 0,070 NTRK2

neurotrophic tyrosine kinase,

receptor, type 2 4,886

*GO:0042573 retinoic acid metabolic process 0,071 CYP26B1

cytochrome P450, family 26, subfamily B, polypeptide 1

12,256

CYP26A1

cytochrome P450, family 26, subfamily A, polypeptide 1

8,348

CRABP2

cellular retinoic acid binding protein 2

3,185

Page 69: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

57

*GO:0048384 retinoic acid receptor

signaling pathway 0,080 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,256

CYP26A1

cytochrome P450, family 26,

subfamily A, polypeptide 1 8,348

RARB retinoic acid receptor, beta 3,115

*GO:0034653 retinoic acid catabolic

process 0,084 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,256

CYP26A1

cytochrome P450, family 26,

subfamily A, polypeptide 1 8,348

*GO:0001972 retinoic acid binding 0,088 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,256

CYP26A1

cytochrome P450, family 26,

subfamily A, polypeptide 1 8,348

CRABP2

cellular retinoic acid binding

protein 2 3,185

*GO:0008401 retinoic acid 4-hydroxylase activity 0,089 CYP26B1

cytochrome P450, family 26, subfamily B, polypeptide 1

12,256

CYP26A1

cytochrome P450, family 26, subfamily A, polypeptide 1

8,348

*GO:0046928 regulation of neurotransmitter

secretion 0,095 NTRK2

neurotrophic tyrosine kinase,

receptor, type 2 4,886

*GO:0052650 NADP-retinol dehydrogenase activity 0,098 DHRS3

dehydrogenase/reductase (SDR family) member 3

6,138

RDH10

retinol dehydrogenase 10 (all-trans)

1,529

*GO:0003708 retinoic acid receptor activity 0,098 RARB retinoic acid receptor, beta 3,115

Page 70: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

58

Tabla 10. Clasificación en categorías GO de los genes infraexpresados tras 24 horas de tratamiento con RA.

GO.Term.Name adj.pvalue Gene.Name Description M

GO:0005515 protein binding 0,004 LRRC4 leucine rich repeat containing 4 -2,073

CBLN4 cerebellin 4 precursor -3,882

TNNI3K TNNI3 interacting kinase -7,897

GAP43 growth associated protein 43 -1,446

PPAP2B

phosphatidic acid phosphatase type

2B -1,623

NELL1 NEL-like 1 (chicken) -3,132

GRIN1

glutamate receptor, ionotropic, N-

methyl D-aspartate 1 -1,988

GPC3 Glypican 3 -1,756

*GO:0003824 catalytic activity 0,008 PDE3A

phosphodiesterase 3A, cGMP-

inhibited -1,581

SULF2 sulfatase 2 -1,629

PPAP2B phosphatidic acid phosphatase type 2B

-1,623

*GO:0008354 germ cell

migration 0,039 PPAP2B

phosphatidic acid phosphatase type

2B -1,623

*GO:0030054 cell junction 0,057 LRRC4 leucine rich repeat containing 4 -2,073

CHRM2 cholinergic receptor, muscarinic 2 -1,954

CBLN4 cerebellin 4 precursor -3,882

GAP43 growth associated protein 43 -1,446

GRIN1 glutamate receptor, ionotropic, N-methyl D-aspartate 1

-1,988

*GO:0019933 cAMP-mediated

signaling 0,100 PDE3A

phosphodiesterase 3A, cGMP-

inhibited -1,581

Page 71: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

59

Tabla 11. Clasificación en catergorías GO de los genes sobreexpresados tras 48 horas de tratamiento con RA.

Go.Term.Name adj.pvalue Gene.Name Description M

*GO:0043066 negative regulation of

apoptotic process 7,164e-06 PLK2 polo-like kinase 2 2,125

FOXC1 forkhead box C1 1,843

SOX9 SRY (sex determining region

Y)-box 9 1,901

KRT18 keratin 18 4,441

EGR1 early growth response 1 3,568

AQP1 aquaporin 1 1,609

CTSH cathepsin H 1,479

GO:0007186 G-protein coupled receptor signaling

pathway

0,002 RGS13 regulator of G-protein signaling

13 8,539

DAPL1 death associated protein-like 1 5,062

GPR146 G protein-coupled receptor 146

3,639

PTGIR prostaglandin I2 (prostacyclin) receptor (IP)

2,529

LPAR1 lysophosphatidic acid receptor 1

1,718

GO:0007165 signal transduction 0,002 RET ret proto-oncogene 3,531

CRABP2 cellular retinoic acid binding protein 2

3,375

RARB retinoic acid receptor, beta 3,196

SMOC1 SPARC related modular

calcium binding 1 4,330

SOX9 SRY (sex determining region

Y)-box 9 1,901

PDE4C phosphodiesterase 4C, cAMP-specific

1,751

TNFRSF25 tumor necrosis factor receptor superfamily, member 25

1,654

PRKCH protein kinase C, eta 1,379

*GO:0007399 nervous system development

0,003 RET ret proto-oncogene 3,531

MPPED2 metallophosphoesterase domain containing 2

3,256

INHBA inhibin, beta A 1,880

C4orf6 chromosome 4 open reading

frame 6 7,561

NAV2 neuron navigator 2 1,432

GO:0005524 ATP binding 0,004 NTRK2 neurotrophic tyrosine kinase,

receptor, type 2 4,724

RET ret proto-oncogene 3,531

PLK2 polo-like kinase 2 2,125

NAV2 neuron navigator 2 1,432

EPHB3 EPH receptor B3 1,893

PRKCH protein kinase C, eta 1,379

*GO:0030154 cell differentiation 0,005 SMOC1 SPARC related modular calcium binding 1

4,330

MGP matrix Gla protein 4,067

BHLHE41 basic helix-loop-helix family,

member e41 8,251

DAPL1 death associated protein-like 1 5,062

INHBA inhibin, beta A 1,880

SOX9 SRY (sex determining region

Y)-box 9 1,901

GO:0006468 protein phosphorylation 0,013 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

RET ret proto-oncogene 3,531

PLK2 polo-like kinase 2 2,125

LAMA4 laminin, alpha 4 2,320

Page 72: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

60

CALCA calcitonin-related polypeptide alpha

7,715

SOX9 SRY (sex determining region

Y)-box 9 1,901

EPHB3 EPH receptor B3 1,893

PRKCH protein kinase C, eta 1,379

GO:0007155 cell adhesion 0,013 NCAM2 neural cell adhesion molecule

2 2,394

ITGA1 integrin, alpha 1 1,958

AJAP1 adherens junctions associated protein 1

2,001

LAMA4 laminin, alpha 4 2,320

GO:0007158 neuron cell-cell adhesion 0,014 RET ret proto-oncogene 3,531

NCAM2 neural cell adhesion molecule

2 2,394

GO:0030155 regulation of cell adhesion

0,051 RET ret proto-oncogene 3,531

LAMA4 laminin, alpha 4 2,320

SOX9 SRY (sex determining region

Y)-box 9 1,901

*GO:0010976

positive regulation of neuron projection

development

0,052 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

RET ret proto-oncogene 3,531

GO:0043025 neuronal cell body 0,052 NTRK2 neurotrophic tyrosine kinase,

receptor, type 2 4,724

CALCA calcitonin-related polypeptide

alpha 7,715

*GO:0043197 dendritic spine 0,052 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

LPAR1 lysophosphatidic acid receptor 1

1,718

GO:0005178 integrin binding 0,052 ITGA1 integrin, alpha 1 1,958

GO:0043123

positive regulation of I-

kappaB kinase/NF-kappaB cascade

0,053 TGM2 transglutaminase 2 2,940

PLK2 polo-like kinase 2 2,125

LPAR1 lysophosphatidic acid receptor

1 1,718

*GO:0070371 ERK1 and ERK2 cascade 0,065 SOX9 SRY (sex determining region Y)-box 9

1,901

CTSH cathepsin H 1,479

*GO:0071300 cellular response to retinoic acid

0,068 CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1

12,217

CYP26A1 cytochrome P450, family 26, subfamily A, polypeptide 1

8,441

RET ret proto-oncogene 3,531

SOX9 SRY (sex determining region

Y)-box 9 1,901

AQP1 aquaporin 1 1,609

*GO:0014032 neural crest cell

development 0,073 CYP26A1

cytochrome P450, family 26,

subfamily A, polypeptide 1 8,441

FOXC1 forkhead box C1 1,843

SOX9 SRY (sex determining region Y)-box 9

1,901

RDH10 retinol dehydrogenase 10 (all-trans)

1,482

*GO:0021954 central nervous system

neuron development 0,073 NTRK2

neurotrophic tyrosine kinase,

receptor, type 2 4,724

*GO:0060291 long-term synaptic potentiation

0,073 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

PLK2 polo-like kinase 2 2,125

EGR1 early growth response 1 3,568

*GO:0042573 retinoic acid metabolic

process 0,073 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,217

CYP26A1 cytochrome P450, family 26,

subfamily A, polypeptide 1 8,441

CRABP2 cellular retinoic acid binding

protein 2 3,375

Page 73: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Resultados y discusión

61

*GO:0042572 retinol metabolic process 0,073 DHRS3 dehydrogenase/reductase

(SDR family) member 3 6,120

RDH10 retinol dehydrogenase 10 (all-

trans) 1,482

*GO:0048384 retinoic acid receptor signaling pathway

0,073 CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1

12,217

CYP26A1 cytochrome P450, family 26,

subfamily A, polypeptide 1 8,441

RARB retinoic acid receptor, beta 3,196

*GO:0034653 retinoic acid catabolic

process 0,086 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,217

CYP26A1 cytochrome P450, family 26,

subfamily A, polypeptide 1 8,441

*GO:0001972 retinoic acid binding 0,087 CYP26B1 cytochrome P450, family 26, subfamily B, polypeptide 1

12,217

CYP26A1 cytochrome P450, family 26, subfamily A, polypeptide 1

8,441

CRABP2 cellular retinoic acid binding protein 2

3,375

*GO:0008401 retinoic acid 4-

hydroxylase activity 0,091 CYP26B1

cytochrome P450, family 26,

subfamily B, polypeptide 1 12,217

CYP26A1 cytochrome P450, family 26,

subfamily A, polypeptide 1 8,441

*GO:0046928

regulation of neurotransmitter

secretion

0,091 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

*GO:0042417 dopamine metabolic process

0,091 NTRK2 neurotrophic tyrosine kinase, receptor, type 2

4,724

*GO:0052650 NADP-retinol

dehydrogenase activity 0,095 DHRS3

dehydrogenase/reductase

(SDR family) member 3 6,120

RDH10 retinol dehydrogenase 10 (all-trans)

1,482

Page 74: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 75: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

5. CONCLUSIONES

Page 76: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 77: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Conclusiones

65

En base a los resultados mostrados, se ha llegado a las siguientes conclusiones:

1. Respecto a la cuantificación de miR-10a y miR-10b mediante RT-PCR, se ha

observado un aumento de los mismos en las células tratadas con RA durante 24 y 48

horas con respecto al control (0 horas), confirmándose el hecho de que el RA ha

inducido la diferenciación celular (figura 16).

2. Tras la secuenciación por RNA-Seq de las muestras control 1 (0 horas), control 2 (0

horas), 24 horas RA 1, 24 horas RA 2, 48 horas RA 1 y 48 horas RA 2 mediante la

tecnología SOLiD, se han analizado las lecturas obtenidas mediante NOISeq.

Los resultados de los análisis iniciales realizados con NOISeq revelan que las muestras

no se agrupan de la forma que se esperaría, tal y como se muestra en el PCA de score

plots en la figura 24. Dentro de este agrupamiento anómalo, el control 2 es la muestra

que más difiere respecto a su réplica; es por ello que se ha decidido excluirla del

análisis. Esto ha repercutido en resultados posteriores, ya que no se ha podido calcular

el valor M de expresión diferencial para control 1.

El agrupamiento anómalo de las muestras podría haber sido causado durante el

procesamiento de la muestras para la secuenciación, al haber mezclado muestras o

confundir etiquetas. Esta última opción es menos probable, ya que ninguna otra muestra

tiene conteos similares a los del control 1 en cuanto a los genes CYP26A1, CYP26B1 y

DHRS3 implicados en el metabolismo del RA (figura 23).

Para evitar este tipo de situaciones, convendría secuenciar tres réplicas para cada

condición. Asímismo, quizás sería recomendable volver a realizar la secuenciación con

Illumina, puesto que estudios de secuenciación realizados con Illumina y SOLiD

muestran que el primero tiene una mayor eficancia de mapeo que el segundo [29].

3. A pesar de que, por lo general, los genes relacionados con el metabolismo del RA y

diferenciación neuronal se encuentran sobrerregulados, coincidiendo con lo que se

podría esperar, se hace necesario repetir el proceso de secuenciación, tal y como se

menciona en el punto anterior, para obtener una mayor significación estadística y poder

dar una mayor fiabilidad a los resultados obtenidos mediante los análisis

bioinformáticos. Posteriormente, debería realizarse una validación por RT-PCR de los

genes sobreexpresados o infraexpresados que se consideren más relevantes en la

diferenciación neuronal y/o en el metabolismo del RA.

En cuanto al análisis de enriquecimiento de términos GO, resulta llamativo el hecho de

que ciertos genes infraexpresados durante 24 horas de tratamiento estén relacionados

con la diferenciación, y que ciertos genes sobrerregulados durante 24 y 48 horas de

tratamiento se asocien a la proliferación en muchos tipos tumorales. En muchos de los

genes detallados en el apartado 4.6 no se ha descrito implicación en el contexto del

neuroblastoma ni de la diferenciación celular/neuronal inducida por RA, lo que hace

necesario la realización de estudios adicionales que esclarezcan el papel que ejercen en

dicho contexto.

Debido a que solapan muchos de los genes sobreexpresados durante 24 y 48 horas de

tratamiento con RA, sería conveniente añadir una duración de tratamieto más distante

(por ejemplo, 96 horas), para conocer la expresión de genes tardíos o más a largo plazo.

Page 78: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 79: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

6. FUTURAS

PERSPECTIVAS

Page 80: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 81: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Futuras perspectivas

69

Tras la validación por RT-PCR de todos aquellos genes sobre e infraexpresados en 24 y

48 horas de tratamiento con RA que se consideren de mayor interés en neuroblastoma

y/o diferenciación neuronal, convendría realizar experimentos en los que compruebe si

dichos genes interaccionan o varían su expresión con miR-10a y miR-10b mediante la

transfección de pre-miRs y anti-miRs en células SH-SY5Y tratadas con RA a diferentes

tiempos.

Puesto que se ha descrito que el éster de forbol o TPA funciona también como agente

diferenciador de células de neuroblastoma [22], se propone la realización de

experimentos en los que se valide la inducción de miR-10a y miR-10b en células

tratadas con TPA mediante RT-PCR así como la secuenciación de su RNA para

comparar los efectos que tiene el tratamiento de TPA con respecto al tratamiento con

RA.

Además, sería interesante realizar el experimento planteado con un tratamiento conjunto

de RA y TPA en células de neuroblastoma para conocer qué impacto tendría sobre la

diferención neuronal, si ejercen un efecto sinérgico y si varía la expresión génica con

respecto a cada tratamiento por separado.

Page 82: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 83: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

7. BIBLIOGRAFÍA

Page 84: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo
Page 85: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Bibliografía

73

1. Meseguer S. Regulación de la expresión génica durante la diferenciación de células

SH-SY5Y inducida por ácido retinoico: splicin alternativo y Micro-RNAs [Tesis

doctoral].Valencia: Universidad de Valencia, Facultad de Ciencias Biológicas; 2011.

2. D'Ambrosio DN, Clugston RD, Blaner WS. Vitamin A metabolism: An update.

Nutrients 2011;3(1):63-103.

3 . Blomhoff R, Green MH, Berg T, Norum KR. Transport and storage of vitamin A.

Science 1990;250(4979):399-404.

4. Perusek L, Maeda T. Vitamin A derivatives as treatment options for retinal

degenerative diseases. Nutrients 2013;5(7):2646-2666.

5 Kawaguchi R, Yu J, Honda J, Hu J, Whitelegge J, Ping P, et al. A membrane receptor

for retinol binding protein mediates cellular uptake of vitamin A. Science

2007;315(5813):820-825.

6 .Porté S, Xavier Ruiz F, Giménez J, Molist I, Alvarez S, Domínguez M, et al. Aldo–

keto reductases in retinoid metabolism: Search for substrate specificity and inhibitor

selectivity. Chem Biol Interact 2013 2/25;202(1–3):186-194.

7. Sandell LL, Lynn ML, Inman KE, McDowell W, Trainor PA. RDH10 Oxidation of

Vitamin A Is a Critical Control Step in Synthesis of Retinoic Acid

during Mouse Embryogenesis. PLoS ONE 2012;7(2)

8. Rhinn M, Dollé P. Retinoic acid signalling during development. Development

2012;139(5):843-858.

9. Chithalen JV, Luong L, Petkovich M, Jones G. HPLC-MS/MS analysis of the

products generated from all-trans-retinoic acid using recombinant human CYP26A.

Journal of Lipid Research 2002;43:1133-1142.

10. Gonzalez-Quevedo R, Lee Y, Poss KD, Wilkinson DG. Neuronal Regulation of the

Spatial Patterning of Neurogenesis. Developmental Cell 2010 1/19;18(1):136-147.

11. White RJ, Nie Q, Lander AD, Schilling TF. Complex regulation of cyp26a1 creates

a robust retinoic acid gradient in the zebrafish embryo. PLoS Biol 2007;5(11):2522-

2533.

12. Masiá S, Alvarez S, De Lera AR, Barettino D. Rapid, nongenomic actions of

retinoic acid on phosphatidylinositol-3-kinase signaling pathway mediated by the

retinoic acid receptor. Molecular Endocrinology 2007;21(10):2391-2402.

13. López-Carballo G, Moreno L, Masiá S, Pérez P, Barettino D. Activation of the

phosphatidylinositol 3-kinase/Akt signaling pathway by retinoic acid is required for

neural differentiation of SH-SY5Y human neuroblastoma cells. J Biol Chem

2002;277(28):25297-25304.

14. Dudek H, Datta SR, Franke TF, Birnbaum MJ, Yao R, Cooper GM, et al.

Regulation of neuronal survival by the serine-threonine protein kinase Akt. Science

1997;275(5300):661-665.

15. Franke TF, Kaplan DR, Cantley LC. PI3K: Downstream AKTion blocks apoptosis.

Cell 1997;88(4):435-437.

16. Scheid MP, Marignani PA, Woodgett JR. Multiple phosphoinositide 3-kinase-

dependent steps in activation of protein kinase B. Mol Cell Biol 2002;22(17):6247-

6260.

17. Leevers SJ, Vanhaesebroeck B, Waterfield MD. Signalling through

phosphoinositide 3-kinases: The lipids take centre stage. Curr Opin Cell Biol

1999;11(2):219-225.

18. Brunet A, Datta SR, Greenberg ME. Transcription-dependent and -independent

control of neuronal survival by the PI3K-Akt signaling pathway. Curr Opin Neurobiol

2001;11(3):297-305.

Page 86: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Bibliografía

74

19. «Prevalence of rare diseases: Bibliographic data », Informes Periódicos de

Orphanet, Serie Enfermedades Raras, Noviembre 2013, Número 2: Lista por orden de

prevalencia decreciente o por número de casos publicados.

20. Castel V, Cañete A, Noguera R, Navarro S, Oltra S. Neuroblastoma. Clinical and

Translational Oncology 2005;7(3):133-145.

21. Park JR, Bagatell R, London WB, Maris JM, Cohn SL, Mattay KM, et al.

Children's Oncology Group's 2013 blueprint for research: Neuroblastoma. Pediatric

Blood and Cancer 2013;60(6):985-993.

22. Kovalevich J, Langford D. Considerations for the use of SH-SY5Y neuroblastoma

cells in neurobiology. Methods in Molecular Biology 2013;1078:9-21.

23. Zhi F, Wang R, Wang Q, Xue L, Deng D, Wang S, et al. MicroRNAs in

Neuroblastoma: Small-Sized Players with a Large Impact. Neurochem Res 2014:1-11.

24. Meseguer S, Mudduluru G, Escamilla JM, Allgayer H, Barettino D. MicroRNAs-

10a and -10b contribute to retinoic acid-induced differentiation of neuroblastoma cells

and target the alternative splicing regulatory factor SFRS1 (SF2/ASF). J Biol Chem

2011;286(6):4150-4164.

25. Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, et al. Differential gene

and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks.

Nature Protocols 2012;7(3):562-578.

26. García-Alcalde F, Okonechnikov K, Carbonell J, Cruz LM, Götz S, Tarazona S, et

al. Qualimap: Evaluating next-generation sequencing alignment data. Bioinformatics

2012;28(20):2678-2679.

27. Tarazona S, Furio-Tari P, Ferrer A, Conesa A. NOISeq: Exploratory analysis and

differential expression for RNA-seq data 2012

28. Tarazona S., García-Alcalde F., Ferrer A., Dopazo J., and Conesa A. Differential

expression in RNA-seq: a matter of depth. Genome Research 2011;21:2213-2223

29. Young MD, Wakefield MJ, Smyth GK, Oshlack A. Gene Ontology analysis for

RNA-Seq: accounting for selection bias. Genome Biology 2010;11(2)

30. Harismendy O, Ng PC, Strausberg RL, Wang X, Stockwell TB, Beeson KY, et al.

Evaluation of next generation sequencing platforms for population targeted sequencing

studies. Genome Biol 2009;10(3)

31. Prasad KN, Cole WC, Yan X-, Nahreini P, Kumar B, Hanson A, et al. Defects in

cAMP-pathway may initiate carcinogenesis in dividing nerve cells: A review. Apoptosis

2003;8(6):579-586.

32. Tsukahara T, Matsuda Y, Haniu H . Cyclic Phosphatidic Acid Stimulates cAMP

Production and Inhibits Growth in Human Colon Cancer Cells 2013. PLoS ONE 8(11).

33. Gadiya M, Mori N, Cao MD, Mironchik Y1 Kakkad S, Gribbestad IS, Glunde

K, Krishnamachary B, Bhujwalla ZM. Phospholipase D1 and choline kinase-α are

interactive targets in breast cancer. Cancer Biol Ther. 2014;15(5)

34. Tang H, Wang Z, Liu X, Liu Q, Xu G, Li G, et al. LRRC4 inhibits glioma cell

growth and invasion through a miR-185- dependent pathway. Current Cancer Drug

Targets 2012;12(8):1032-1042.

35. Gosso FM, de Geus EJC, Polderman TJC, Boomsma DI, Posthuma D, Heutink P.

Exploring the functional role of the CHRM2 gene in human cognition: Results from a

dense genotyping and brain expression study. BMC Medical Genetics 2007;8.

36. Matsuda K, Yuzaki M. Cbln family proteins promote synapse formation by

regulating distinct neurexin signaling pathways in various brain regions. Eur J Neurosci

2011;33(8):1447-1461.

Page 87: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Bibliografía

75

37. Acosta S, Lavarino C, Paris R, Garcia I, De Torres C, Rodríguez E, et al.

Comprehensive characterization of neuroblastoma cell line subtypes reveals bilineage

potential similar to neural crest stem cells. BMC Developmental Biology 2009;9(1).

38 .Milagre I, Nunes MJ, Castro-Caldas M, Moutinho M, Gama MJ, Rodrigues E.

Neuronal differentiation alters the ratio of Sp transcription factors recruited to the

CYP46A1 promoter. J Neurochem 2012;120(2):220-229.

39. Wade A, Robinson AE, Engler JR, Petritsch C, James CD, Phillips JJ.

Proteoglycans and their roles in brain cancer. FEBS Journal 2013;280(10):2399-2417.

40. Ma Y, Koza-Taylor PH, DiMattia DA, Hames L, Fu H, Dragnev KH, et al.

Microarray analysis uncovers retinoid targets in human bronchial epithelial cells.

Oncogene 2003;22(31):4924-4932.

41. Hayashi M, Okabe K, Kato K, Okumura M, Fukui R, Fukushima N, et al.

Differential function of lysophosphatidic acid receptors in cell proliferation and

migration of neuroblastoma cells. Cancer Lett 2012;316(1):91-96.

42. Dedoni S, Olianas MC, Ingianni A, Onali P. Tipe I interferons impar BDNF-

induced cell signalling and neurotrophic activity in differentiated human SH-SY5Y

neuroblastoma cells and mouse primary cortical neurons. J. Neurochem 2012;122:58-71

43. Katsuki H, Kurimoto E, Takemori S, Kurauchi Y, Hisatsune A, Isohama Y, Izumi

T, Shudo K, Akaire A. Retinoic acid receptor stimulation protects midbrain

dopaminergic neurons from inflammatory degeneration via BDNF-mediated signalling.

J. Neurochem 2009:707-718.

44. Suri D, Vaidya VA. Glucocorticoid regulation of brain-derived neurotrophic factor:

Relevance to hippocampal structural and functional plasticity. Neuroscience

2013;239:196-213.

45. Seeburg DP, Pak D, Sheng M. Polo-like kinase in the nervous system. Oncogene

2005;24:292-298.

46. Betancur P, Bronner-Fraser M, Sauka-Spengler T. Assembling neural crest

regulatory circuits into a gene regulatory network. Annual Review of Cell and

Developmental Biology 2010;26:581-603.

47. Gudas LJ, Wagner JA. Retinoids regulate stem cell differentiation. J Cell Physiol

2011;226(2):322-330.

48. Jiang Q, Cao C, Lu S, Kivlin R, Wallin B, Chu W, Bi Z, Wang X, Wan Y.

MEK/ERK pathway mediates UVB-induced AQP1 downregulation and water

permeability impairment in human retinal pigment epithelial cells. Int J Mol

Med. 2009;23(6):771-7.

49. Brellier F, Ruggiero S, Zwolanek D, Martina E, Hess D, Brown-Luedi M, et al.

SMOC1 is a tenascin-C interacting protein over-expressed in brain tumors. Matrix

Biology 2011;30(3):225-233.

50. Okada I, Hamanoue H, Terada K, Tohma T, Megarbane A, Chouery E, et al.

SMOC1 is essential for ocular and limb development in humans and mice. Am J Hum

Genet 2011;88(1):30-41.

51. Mertsch S, Schurgers LJ, Weber K, Paulus W, Senner V. Matrix gla protein (MGP):

An overexpressed and migration-promoting mesenchymal component in glioblastoma.

BMC Cancer 2009;9:302.

52. Sun L, Ryan DG, Zhou M, Sun T-, Lavker RM. EEDA: A protein associated with

an early stage of stratified epithelial differentiation. J Cell Physiol 2006;206(1):103-

111.

53. Fujimoto K, Shen M, Noshiro M, Matsubara K, Shingu S, Honda K, et al. Molecular

cloning and characterization of DEC2, a new member of basic helix-loop-helix proteins.

Biochem Biophys Res Commun 2001;280(1):164-171.

Page 88: SECUENCIACIÓN POR RNA-Seq Y ANÁLISIS DEL …digital.csic.es/bitstream/10261/93271/3/Zara Sáez García _TFM Marzo 2014.pdf · Realizado por: Zara Sáez García Directores: Domingo

Bibliografía

76

54. Mitew S, Hay CM, Peckham H, Xiao J, Koenning M, Emery B. Mechanisms

regulating the development of oligodendrocytes and central nervous system myelin.

Neuroscience 2014.

55. Hao N, Bhakti LD, Peet DJ, and Whitelaw ML. Reciprocal regulation of the

basichelix–loop–helix/Per–Arnt–Sim partner proteins,Arnt and Arnt2, during neuronal

differentiation. Nucleic Acids Research 2013;41(11):5626–5638.

56. Oppenheimer O, Cheung N-, Gerald WL. The RET oncogene is a critical

component of transcriptional programs associated with retinoic acid-induced

differentiation in neuroblastoma. Molecular Cancer Therapeutics 2007;6(4):1300-1309.

57. Liguori L, Andolfo I, De Antonellis P, Aglio V, Di Dato V, Marino N, et al. The

metallophosphodiesterase Mpped2 impairs tumorigenesis in neuroblastoma. Cell Cycle

2012;11(3):569-581.

58. Miller MC, Lambert-Messerlian GM, Eklund EE, Heath NL, Donahue JE, Stopa

EG. Expression of Inhibin/Activin Proteins and Receptors in the Human Hypothalamus

and Basal Forebrain. J Neuroendocrinol 2012;24(6):962-972.

59. Zage PE, Nolo R, Fang W, Stewart J, Garcia-Manero G, Zweidler-Mckay PA.

Notch pathway activation induces neuroblastoma tumor cell growth arrest. Pediatric

Blood and Cancer 2012;58(5):682-689.

60. Marzinkea MA , Mavencampa T, Duratinskya J , Clagett-Damea M. 14-3-3ε and

NAV2 interact to regulate neurite outgrowth and axon elongation. Archives of

Biochemistry and Biophysics 2013;540:94-100.

61. Cederlund ML, Vendrell V, Morrissey ME, Yin J, Gaora PÓ, Smyth VA, et al.

Mab21l2 transgenics reveal novel expression patterns of mab21l1 and mab21l2, and

conserved promoter regulation without sequence conservation. Developmental

Dynamics 2011;240(4):745-754.

62. Yamada R, Mizutani-Koseki Y, Koseki H, Takahashi N. Requirement for Mab21l2

during development of murine retina and ventral body wall. Dev Biol 2004;274(2):295-

307.

63. Siegenthaler JA, Ashique AM, Zarbalis K, Patterson KP, Hecht JH, Kane MA, et al.

Retinoic Acid from the Meninges Regulates Cortical Neuron Generation. Cell

2009;139(3):597-609.

64. Koldamova R, Schug J, Lefterova M, Cronican AA, Fitz NF, Davenport FA, et al.

Genome-wide approaches reveal EGR1-controlled regulatory networks associated with

neurodegeneration. Neurobiol Dis 2014;63:107-114.

65. Taniguchi T, Tanaka S, Ishii A, Watanabe M, Fujitani N, Sugeo A, et al. A brain-

specific Grb2-associated regulator of extracellular signal-regulated kinase

(Erk)/mitogen-activated protein kinase (MAPK) (GAREM) subtype, GAREM2,

contributes to neurite outgrowth of neuroblastoma cells by regulating erk signaling. J

Biol Chem 2013;288(41):29934-29942.

66. Douglas Lu W, Funkelstein L, Toneff T, Reinheckel T, Peters C, Hook V.

Cathepsin H functions as an aminopeptidase in secretory vesicles for production of

enkephalin and galanin peptide neurotransmitters. J Neurochem 2012;122(3):512-522.