Facultad de Ciencias...
Transcript of Facultad de Ciencias...
Estudio molecular de la Esclerosis Lateral Amiotrófica
Facultad d
e C
iencia
s E
xperim
enta
les
UNIVERSIDAD DE JAÉN Facultad de Ciencias Experimentales
Trabajo Fin de Grado
Trabajo Fin de Grado
Estudio molecular de la esclerosis lateral amiotrófica
mediante biología de sistemas.
Alumno: Rocío Fernández Mesa
Julio, 2017
2
3
ESTUDIO MOLECULAR DE LA
ESCLEROSIS LATERAL
AMIOTRÓFICA MEDIANTE
BIOLOGÍA DE SISTEMAS
Alumno: Rocío Fernández Mesa
Julio, 2017
Facultad d
e C
iencia
s E
xperim
enta
les
UNIVERSIDAD DE JAÉN Facultad de Ciencias Experimentales
Trabajo Fin de Grado
Trabajo Fin de Grado
4
5
ÍNDICE RESUMEN - Palabras clave ………………………………………………. 7
ABSTRACT- Keywords…….……………………………………………….. 7
1. INTRODUCCIÓN…………………………………………………………. 9
2. OBJETIVOS……………………………………………………………….. 13
3. MATERIAL Y MÉTODOS………………………………………………... 15
3.1. Detección de genes implicados en ELA…………………………... 15
3.2. Red de interacción…………………………………………………… 15
3.3. Análisis de red mediante Cytoscape………………………………. 15
4. RESULTADOS…………………………………………………………….. 17
4.1. Genes implicados en ELA…………………………………………... 17
4.2. Redes de interacción y análisis de enriquecimiento funcional….. 18
4.3. Análisis de red mediante Cytoscape……………………………….. 22
5. DISCUSIÓN………………………………………………………………… 25
6. CONCLUSIONES………………………………………………………….. 29
7. BIBLIOGRAFÍA…………………………………………………………….. 31
6
7
RESUMEN
La esclerosis lateral amiotrófica (ELA) es una enfermedad caracterizada por la
parálisis muscular progresiva, principalmente debido a la degeneración de
neuronas motoras de la corteza y de la médula espinal. Aunque se han llevado
a cabo numerosas investigaciones sobre esta enfermedad neurodegenerativa
heterogénea, a día de hoy sigue siendo un enigma descubrir tanto su origen
como su compleja evolución. En el presente trabajo estudiamos las relaciones
y funciones biológicas de las moléculas que intervienen en la enfermedad; en
concreto, la interacción entre sus productos génicos asociados, utilizando para
ello como herramienta la Biología de Sistemas. Los resultados que se han
obtenido muestran cuales son los genes más importantes que interviene en la
ELA, e incluso hemos detectado genes que hasta el momento no se habían
asociado a la enfermedad y, sin embargo, constituyen uno de los componentes
principales en las interacciones establecidas en las redes biológicas
analizadas. Finalmente, podemos concluir que la Biología de Sistemas es de
gran utilidad a la hora de realizar un estudio a nivel molecular de sistemas
complejos, con la finalidad de detectar posibles dianas terapéuticas.
Palabras clave: Biología de Sistemas - Redes de Interacción de Proteínas -
Esclerosis Lateral Amiotrófica - Intermediación – Grado de Conectividad.
ABSTRACT
Amyotrophic lateral sclerosis (ALS) is a disease characterized by progressive
muscle paralysis, mainly due to the degeneration of motor neurons in the cortex
and spinal cord. Although many intensive investigations have been carried out
on this heterogeneous neurodegenerative disease, the origin and evolution of
the complex molecular alterations are not well known. In the present work, we
study the biological interactions and functions of the molecules detected in this
complex disease using a Systems Biology approach. The obtained results point
to important genes participating in ALS and, even more, we have detected
some genes that until now were not previously described as a possible cause of
this disease. Finally, we can conclude that Systems Biology is a useful
approach to study the molecular complexity of both biological and pathological
processes, including the detection of posible therapeutic targets.
8
Keywords: Systems Biology - Protein Interaction Networks - Amyotrophic Lateral Sclerosis – Betweenness - Degree
9
1. INTRODUCCIÓN
La biología molecular, acompañada del desarrollo tecnológico, ha
experimentado un enorme avance en las últimas décadas. Dicho avance ha
permitido la identificación de genes concretos y sus productos génicos, de tipos
celulares específicos, así como de procesos biológicos y moleculares sobre los
que se basan la función de órganos y sistemas y sus alteraciones en procesos
patológicos. No obstante, la información proporcionada por este tipo de
investigación, que puede considerarse de tipo reduccionista, no es del todo
suficiente para llegar a entender el funcionamiento y la interrelación de dichos
procesos en los sistemas vivos o las alteraciones que se producen en
determinadas enfermedades complejas (Niklinski et al., 2017). Es por ello que
se hace necesario el abordaje multidisciplinar del estudio de los sistemas
complejos a través de la Biología de Sistemas, la cual integra y relaciona
disciplinas como la Biología Molecular, la Bioinformática, las Matemáticas y la
Física (Babtie et al., 2014).
Cabe destacar, como breve introducción histórica, que fue a partir de
1948 cuando se empezó a considerar el estudio de los procesos biológicos
como sistemas, lo cual fue presentado por el científico estadounidense Norbert
Wiener en su libro “Cibernética o el control y comunicación en animales y
máquinas” (Wiener, 1948). Impulsada por investigadores como Leroy Hood, el
cual es reconocido como uno de los científicos más importantes en el campo
de la Biotecnología Molecular y Genómica, y co-fundador del Institute for
Systems Biology (Hood & Tian et al., 2012), la Biología de Sistemas como
término fue aplicado por primera vez en 1968 por el teórico Mihajlo D.
Mesarovic (Kesić et al., 2016). De modo general, podemos decir que la Biología
de Sistemas trata del estudio de los sistemas biológicos complejos en todos
sus niveles, incluyendo interconexiones entre diferentes disciplinas ómicas
(Genómica, Proteómica, Transcriptómica, Metabolómica y Epigenómica). El
progreso y empleo de las tecnologías de alto rendimiento conlleva que, para el
análisis de la multitud de datos que pueden obtenerse en la investigación
interdisplinaria de la Biología de Sistemas, sea el modelado matemático un
instrumento poderoso para su comprensión (You, 2004). En definitiva, la
estrategia de la Biología de Sistemas se puede entender como una
10
combinación de la aproximaciones ómicas, de integración de datos, de
modelización y de biología sintética (Ge et al., 2003) incluyendo, por lo tanto,
métodos experimentales y el modelado computacional y matemático (Ji et at.,
2017). Como aspecto interesante a destacar, los datos obtenidos de estos
métodos pueden ser integrados y analizados también en forma de redes de
interacción (Aguda & Goryachev, 2007).
Los abordajes propios de la Biología de Sistemas están siendo muy
aplicados, por ejemplo, en el estudio del desarrollo de diferentes tipos de
cáncer ya que, en general, la aparición y desarrollo de tumores es un proceso
biológico multiescalar complejo (Liang & Kelemen, 2017). Además, en la
investigación y la interpretación del código genómico cabe destacar la gran
utilidad que las redes de interacción y reguladoras aportan a estos estudios
genéticos (Chin et al., 2014), incluyendo la detección experimental y el análisis
de las interacciones proteína-proteína (Nguyen et al., 2013), así como las
predicciones in silico (Liu et al., 2013).
Las redes de interacción y reguladoras nos proporcionan una
representación de los elementos biológicos que la componen, los cuales son
interpretados mediante nodos que, a su vez, están relacionados por medio de
un conjunto de aristas que describen las conexiones que relacionan dichos
elementos entre sí, incluyendo dichas conexiones tanto la fuerza de interacción
como su fiabilidad. Así pues, los nodos representan características de interés
en la red, como son los genes y sus niveles de expression, o los términos
funcionales (Vella et al., 2017). En una red de interacción de productos génicos
de tipo proteico, que será la que utilizaremos en el presente trabajo, cabe
destacar el término PPI (interacciones proteína-proteína), el cual no sólo indica
aquellas proteínas que están conectadas físicamente para realizar una función
biológica específica, sino que también indica aquellas proteínas que no lo están
físicamente pero, sin embargo, pueden estar actuar en la regulación, en
catalizar en una vía metabólica reacciones posteriores, así como en la
participación del ensamblaje de estructuras complejas, y haciendo uso, en
ocasiones, de moléculas intermedias (De las Rivas & Fontanillo, 2010). Este
tipo de datos de interacción pueden obtenerse a partir de plataformas
computacionales como STRING, la cual agrupa interacciones tanto directas
11
como indirectas y, en consecuencia, permite construir, a partir de asociaciones
conocidas y previstas, la red de interacción permitiéndonos, en el caso de este
trabajo concreto, especificar aquellos genes que intervienen en la
enfermedades como la ELA (Franceschini et al., 2013). Por otro lado, también
se hace necesario, en el presente trabajo, el empleo de herramientas
computacionales que integren, visualicen y analicen la red biológica obtenida;
en nuestro caso utilizaremos Cytoscape (Saito et al., 2012).
Ha sido en la última década cuando ha tenido lugar la aparición de este
nuevo movimiento de interés en la investigación del estudio de las redes
complejas las cuales, además, pueden evolucionar en el tiempo de forma
dinámica y estar formadas por cientos o miles de nodos. Este impulso se ha
debido al aumento de la potencia computacional y como consecuencia del
estudio de las propiedades que contienen las redes a partir de las grandes
bases de datos de interés en biología y medicina (Boccaletti et al., 2006;
Voevodski et at., 2009; Pellegrini et al., 2016; Mete et al., 2008). En el análisis
de redes es interesante obtener parámetros de centralidad de los nodos. Por
ejemplo, el grado de centralidad (degree), el cual hace referencia al número de
vínculos que establece un nodo en concreto con los demás nodos vecinos; el
grado en que un nodo es partícipe en transacciones entre otros nodos puede
ser detectado a través del parámetro denominado intermediación o
betweenness (Cickovski et al., 2017).
Como ejemplo de aplicación de los procedimientos propios de la
Biología de Sistemas nos centraremos en el estudio y análisis de una
enfermedad compleja, la esclerosis lateral amiotrófica (ELA). La ELA se
caracteriza por la presentación de signos y síntomas de degeneración primaria
de las motoneuronas, lo cual genera debilidad y atrofia progresiva de la
musculatura de inervación bulbar, abdominal, torácica y de las extremidades
(Rodríguez de Rivera et al., 2011), siendo causa de discapacidades físicas y
fisiológicas que generalmente producen la muerte de los pacientes. A medida
que se desarrolla la degeneración de las neuronas motoras, que inervan a los
músculos voluntarios, se produce espasticidad, atrofia muscular y la debilidad
de los músculos esqueléticos, siendo la parálisis de los músculos respiratorios
la principal causa de muerte por disfunción respiratoria (Riancho et al., 2016).
12
Hasta el momento, la causa o causas de esta enfermedad son
desconocidas, incluso no se comprenden del todo los mecanismos de su
progresión. Además, se carece de métodos eficaces para su tratamiento, si
bien el uso del fármaco riluzol (un inhibidor de los canales de sodio sensibles a
TTX) parece prolongar la supervivencia a esta enfermedad, así como la
utilización de una ventilación no invasiva (Oliveira et al., 2009). El promedio
establecido de esperanza de vida cuando se padece ELA comprende un
rango de entre 2 y 3 años desde que tienen lugar el inicio de los primeros
síntomas; hasta el 50% de pacientes que la sufren incluso llevan asociado
algún grado de deterioro frontotemporal (Hogden et al., 2017)
Aunque en un 10% de pacientes que desarrollan ELA el motivo es
hereditario, en la gran mayoría de pacientes que la sufren es debido a su
aparición esporádica (Corcia et al., 2017). El avance en el conocimiento de las
alteraciones genéticas producidas en la enfermedad, ha dado lugar a
numerosos modelos, siendo las vías moleculares detectadas a través de estos
modelos muy diversas y no del todo concluyentes (Van Damme et al., 2017).
13
2. OBJETIVOS
El objetivo principal de este Trabajo de Fin de Grado es conocer y
aplicar la metodología propia de la Biología de Sistemas, utilizando como
ejemplo la Esclerosis Lateral Amiotrófica, una enfermedad compleja y mortal
sobre la que detectar los procesos biológicos que se ven afectados y tratar de
identificar posibles dianas terapéuticas. Dicha metodología nos permitirá,
además, integrar conocimientos de diferentes asignaturas estudiadas durante
el Grado.
14
15
3. MATERIAL Y MÉTODOS
3.1. Detección de genes implicados en ELA
Los genes implicados en la ELA han sido obtenidos a partir de la
plataforma Phenopedia, herramienta computacional que lleva a cabo una
búsqueda y selección exhaustiva de genes implicados en enfermedad a partir
de distintas bases de datos (Yu et al., 2010).
3.2 Red de interacción
Una vez obtenidos los genes implicados en la enfermedad, se procede a
la importación del listado de genes en la plataforma STRING (Szklarczyk el at.,
2017), lo cual nos permite la obtención de la red de interacción de los genes de
interés. Las interacciones que incluyen pueden ser directas (físicas) e
indirectas (funcionales). La información proporcionada de esta base de datos,
procede las siguientes fuentes de interacción activas: Textming; Experiments;
Databases; Co-expression: Gene Neighbohood; Gene fusión y Gene Co-
ocurrence. Para las interacciones predichas, se utiliza un valor de confianza
que oscila desde 0,15 (baja confianza) hasta 0,90 (alta confianza), el cual se
selecciona a priori. En nuestro trabajo se han obtenido las redes para valores
de 0,40 (confianza media) y 0,90 (confianza alta). Además, en nuestro caso,
hemos generado las redes de modo que no muestren los nodos sin interacción.
STRING también nos permite llevar a cabo un análisis de enriquecimiento
funcional de los nodos incluidos en la red, ya que se puede generar una tabla
con los procesos biológicos en los que intervienen, las funciones moleculares,
los componentes celulares y, por último, las enfermedades en las que se han
detectado implicados.
3.3. Análisis de red mediante Cytoscape.
La redes de interacciones obtenidas de String fueron posteriormente
analizadas con Cytoscape, un software de libre acceso con el cual, además de
visualizar las interacciones moleculares, pueden obtenerse medidas de
centralidad de la red. Este proyecto de software tiene la capacidad de integrar
las redes de interacción molecular (Shannon et al., 2013 y nos permite el
estudio interconexiones biológicas complejas (Su et al., 2014). En nuestro caso
16
nos resulta de interés obtener la intermediación (betweenness) y el grado de
conectividad (degree), parámetros que nos permiten detectar qué genes tienen
una mayor implicación en la red y deducir su importancia en la misma. El
degree, refleja el grado de conexión de cada nodo. En cuanto al betweenness,
nos indica el grado de intermediación que tiene este nodo respecto a un
conjunto de nodos entre sí, es decir, el grado de intermediación máxima que
ese nodo establece con grupos de nodos vecinos (los cuales también están
relacionados entre sí) y que, por lo tanto, hace de su presencia indispensable
en la red, al actuar como intermediario entre conjuntos de nodos.
En el esquema 1 se muestra un esquema general del procedimiento seguido.
Esquema 1. Esquema de los pasos realizados para el estudio de la Esclerosis Lateral Amiotrófica mediante la Biología de Sistemas.
17
C9orf72 (115) MTHFR (5) CHRNA4 (2) UPF2 (1) MIST (1) LOX (1) NELL1 (1) ZFYVE26 (1) PVR (1)
SOD1 (93) IGFALS (5) XRCC1 (2) COQ2 (1) CLU (1) LTA (1) C12orf65 (1) FXN (1) ZNF704 (1)
TARDBP (54) CHMP2B (5) SHROOM3 (2) GNB3 (1) COX6A1 (1) MIF (1) C7orf57 (1) GALNT1 (1) RGNEF (1)
FUS (44) CHCHD10 (5) SCNN1A (2) GRIK2 (1) PARP1 (1) SUSD1 (1) SYT9 (1) GLA (1) TXNRD1 (1)
ANG (25) MATR3 (4) CST3 (2) MT2A (1) CYP1A2 (1) SNCA (1) AGTR1 (1) HINT1 (1) MED25 (1)
OPTN (22) HNRNPA1 (4) UBQLN1 (2) IL18BP (1) F2 (1) STC1 (1) ALS5 (1) APOA4 (1) PICALM (1)
ATXN2 (20) TMEM106B (4) TAF15 (2) MAN1A2 (1) FMO1 (1) TGFB1 (1) SUNC1 (1) APOB (1) EIF2AK3 (1)
SQSTM1 (18) HNRNPA2B1 (4) MMP9 (2) PSEN1 (1) PINK1 (1) TIAM1 (1) ANGPTL4 (1) LDLR (1) LOC100506746 (1)
GRN (15) TREM2 (4) VDR (2) CAMK1G (1) SPP1 (1) TUBA4A (1) VPS54 (1) LPA (1) SMUG1 (1)
PON1 (15) CHGB (4) NFE2L2 (2) EXOC4 (1) MAP4K3 (1) DERL1 (1) SUSD2 (1) CP (1) SPAST (1)
PFN1 (14) SPG11 (4) PPARG (1) ST3GAL3 (1) ACTR5 (1) FA2H (1) PLEKHG5 (1) DYNC1H1 (1) TTN (1)
APOE (14) ZNF512B (4) ZFP64 (1) RTN4R (1) GSTO1 (1) RECK (1) CHAF1A (1) GPNMB (1) GAN (1)
VEGFA (13) NOP56 (3) PRPH (1) STC2 (1) KEAP1 (1) MACROD2 (1) P4HB (1) TPPP (1) ARHGEF1 (1)
VCP (12) NIPA1 (3) TP53 (1) RAB7L1 (1) HGF (1) PPM1K (1) WNT5A (1) CHRNA3 (1) ARHGAP18 (1)
HFE (12) HTT (3) TRAF6 (1) LRSAM1 (1) HLA-B (1) ADRB2 (1) SMARCA5 (1) HUS1 (1) APEX1 (1)
SMN1 (10) ALS2 (3) WNT10B (1) HSPB1 (1) HLA-DRB5 (1) ZNF519 (1) SLC12A6 (1) APOC3 (1) ICAM1 (1)
DPP6 (10) SETX (3) MOBKL2B (1) KRT18P55 (1) HPGD (1) DCP1A (1) NPPA (1) MMP12 (1) LPL (1)
UNC13A (10) TRPM7 (2) C13orf18 (1) AR (1) IDUA (1) IFNK (1) OGG1 (1) NEFL (1) MTF1 (1)
SMN2 (10) ATXN1 (2) CAV1 (1) JUN (1) ITGB3 (1) DPYD (1) PGF (1) NOS3 (1) SLC11A2 (1)
FGGY (9) ALAD (2) MGAM (1) MMP1 (1) DHFR (1) FLNC (1) GSS (1) GDAP1 (1) POLG (1)
MAPT (8) EWSR1 (2) MFN2 (1) ND5 (1) EPO (1) TRIM2 (1) MMP3 (1) SS18L1 (1) CHIT1 (1)
VEGF (8) ELP3 (2) MUT (1) NEFH (1) FMR1 (1) SYNE1 (1) ROBO4 (1) FBXO8 (1) LRRK2 (1)
UBQLN2 (8) MT3 (2) CYP2U1 (1) EXOSC1 (1) PLD3 (1) CABIN1 (1) FLJ10986 (1) DPYSL3 (1) CTNNB1 (1)
TBK1 (7) UBE2H (2) ADD1 (1) PCSK2 (1) RBMS3 (1) ANK1 (1) SELE (1) SH2B3 (1) CX3CR1 (1)
PON2 (7) TNF (2) CNTN4 (1) SPG21 (1) GRIA2 (1) GSTP1 (1) SPG7 (1) CYP1A1 (1) ADRB3 (1)
KIFAP3 (6) SERPINE1 (2) CYP27A1 (1) PDGFB (1) GBA2 (1) DNAJB2 (1) TF (1) PBRM1 (1) DAO (1)
VAPB (6)2 TYMP (2) AGT (1) RGS14 (1) GSTO2 (1) IGHMBP2 (1) F5 (1) MAP2K5 (1) FGB (1)
ITPR2 (5) Sod1 (2) EPHA3 (1) CETP (1) CR1 (1) INHBA (1) HNRNPA3 (1) PRNP (1)
DCTN1 (5) SIGMAR1 (2) EPHA4 (1) PARK7 (1) LEP (1) ITGA2 (1) Cdh23 (1) RTN4 (1)
PON3 (5) FIG4 (2) F7 (1) CHRNB4 (1) LMNA (1) LIPC (1) NLGN1 (1) PTGS2 (1)
4. RESULTADOS
4.1. Genes implicados en ELA
Se han detectado un total de 267 genes implicados en la ELA, los cuales
se indican en la Tabla 1 ordenados de mayor a menor en función del número
de publicaciones totales en los que se han detectado.
Tabla 1. Genes implicados en la ELA obtenidos a partir de Phenopedia.
18
4.2. Redes de interacción y análisis de enriquecimiento funcional
Se obtuvieron dos redes de interacción de los genes implicados en la
ELA. La primera de ellas (Figura 1) se generó a partir de un índice de confianza
medio (0,40); en ella el número de nodos es de 260, con un total de 1240
conexiones.
Figura 1. Red de interacción proteica, con una confianza de 0,40
19
La segunda red (Figura 2) se obtuvo a partir de un nivel de confianza
alto (0,90) En esta red, el número total de nodos sigue siendo de 260 y el de
conexiones fue de 281.
Figura 2. Red de interacción para un nivel de confianza de 0,90.
20
En la Tabla 2 se muestra el resultado obtenido de las diez interacciones
con mayor valor combinado según los tipos de interacción. En todas ellas,
dicho valor es el mismo (0,999), lo cual indica la importancia de su interacción e
implicación en la red.
Nodo 1 Nodo 2 Neighborhood Genes fusión
Co-ocurrence
Homo-logy
Co-expression Experiments Databases Textmining combined_score
SQSTM1 TRAF6 0 0 0 0 0 0,999 0,9 0,506 0,999
CTNNB1 PSEN1 0 0 0 0 0 0,999 0,9 0,938 0,999
PARP1 XRCC1 0 0 0 0 0,078 0,996 0 0,991 0,999
AR CTNNB1 0 0 0 0 0 0,999 0,9 0,912 0,999
DCTN1 DYNC1H1 0 0 0 0 0,112 0,984 0,9 0,848 0,999
VCP DERL1 0 0 0 0 0 0,999 0 0,923 0,999
NFE2L2 KEAP1 0 0 0 0 0 0,999 0,9 0,979 0,999
LDLR APOB 0 0 0 0 0 0,812 0,9 0,972 0,999
SQSTM1 KEAP1 0 0 0 0 0 0,999 0 0,908 0,999
CAV1 NOS3 0 0 0 0 0 0,962 0,9 0,911 0,999
Tabla 2. Diez primeras interacciones con mayor valor combinado según los criterios de interacción.
La plataforma STRING también permite llevar a cabo un análisis de
enriquecimiento funcional de los nodos incluídos en la red, los cuales se
muestran en la Tabla 3. De entre los resultados obtenidos de dicho análisis de
enriquecimiento funcional cabe destacar que, entre los procesos biológicos en
los que participan los genes incluidos en la red, se encuentran la respuesta
frente al estrés oxidativo, la neurogénesis, la diferenciación neuronal y,
además, la implicación de genes de regulación de la ruta de señalización
apoptótica intrínseca, inducida por dicho estrés oxidativo. Además, también
cabe destacar que las vías metabólicas principales que parecen verse
afectadas son las relacionadas con él cancer, las de señalización de
neurotrofina, e incluso directamente relaccionadas con ELA.
21
Tabla 3. Resultado del análisis de enriquecimiento funcional de los nodos incluídos en la red.
22
4.3 Análisis de red
A continuación se muestra la red de interacción de proteínas obtenida
mediante el uso del software Cytoscape con el cual, además, hemos analizado
y reflejado en la red los parámetros de centralidad: Los nodos de mayor
tamaño indican valores de intermedicación más elevados; el color naranja
corresponde a bajos valores de grado de conectividad, mientras que el color
azul refleja valores altos de conectividad en la red.
Imagen 3. Red de interacción en la ELA. Un mayor tamaño del nodo indica mayor grado de intermediación; el rango de color (de naranja a azul) está directamente relacionado con la conectividad.
23
Para detectar aquellos genes con un grado significativo de conexión o
intermediación se calcularon los valores promedio y la desviación estándar de
ambos (Tabla 4).
Betweenness Degree
Promedio 0,01 10
Desviación estándar 0,02 11
Tabla 4. Tabla que muestra el promedio, desviación estándar para betweenness y degree.
A partir de estos resultados, se consideraron como significativos
aquellos genes que presentaron un valor igual o superior a la media más dos
veces la desviación estándar, tanto para grado como para intermediación (32 y
0,04, respectivamente) los cuales se indican en las Tablas 5 y 6.
Tabla 5. Genes con mayor valor de betweenness.
Destacamos que entre los genes que mayor grado de intermediación,
que hemos detectado en nuestros resultados (Tabla 5), se encuentran TP53,
CTNNB1 y APOE.
Genes betweenness
TP53 0,13
CTNNB1 0,09
APOE 0,08
ITGA2 0,08
JUN 0,07
TARDBP 0,05
PTGS2 0,05
SOD1 0,04
AGT 0,04
24
Genes Degree
TP53 67
ITGA2 57
JUN 52
APOE 51
NOS3 40
VEGFA 39
ICAM1 39
AGT 37
TARDBP 36
TNF 36
LEP 36
MMP9 36
CTNNB1 35
PPARG 35
TGFB1 33
F2 32
SERPINE1 32
Tabla 6. Genes con mayor valor de degree.
En relación al grado de conexión, señalamos que entre los genes que
han presentado un mayor grado se encuentra TP53 e ITGA2, así como el gen
JUN, los cuales coinciden con aquellos que muestran valores altos de
intermediación.
25
5. DISCUSIÓN En el trabajo aquí presentado, se han detectado 267 genes asociados a
la ELA. De entre todos ellos, el gen C9ORF92 (chromosome 9 open reading
frame 72) es el que se considera como uno de los principalmente implicados en
la enfermedad; la alteración molecular se basa en la expansión repetida de
hexanucleótidos GGGGCC que tienen lugar en dicho gen, lo cual, aunque
conlleva la heterocromatización parcial del locus, no impide que los ARN
mutantes y las proteínas dipeptídicas repetidas den lugar a la neurotoxicidad
(Esanov et al., 2017). Estas repeticiones parecen estar relacionadas con el
40% de los casos de ELA, aproximadamente. Los péptidos de repetición en
C9ORF92 terminan formando inclusiones citoplasmáticas neuronales, en
células de gránulos cerebelosos, células de gránulos dentados de giro y células
del hipocampo. El tamaño de las repeticiones de hexanucleótidos es
proporcional a la formación de inclusiones, de manera que cuanto mayor es las
expansiones de las mismas, más favorable será el desarrollo de la enfermedad,
causando deterioro cognitivo (Volkening et al., 2017).
Son otras muchas las mutaciones encontradas en las proteínas que
están asociadas a esta enfermedad, siendo la primera proteína identificada la
superóxido dismutasa (SOD1). Este gen ha sido también detectado, a partir de
los resultados obtenidos, como uno de los principales genes implicados dentro
de los valores altos de intermediación. La proteína mutada se ha encontrado en
depósitos citoplasmáticos, implicando también a SOD1 en la formación de
agregados tóxicos (Bonifacino et al., 2017). Con respecto a las mutaciones
detectadas en este gen, suelen localizarse en los exones y dan como resultado
a un mal funcionamiento de la proteína (Sangwan & Eisenberg, 2016). Desde
el punto de vista estructural, las mutaciones provocan una alteración en la zona
de unión del Zn y Cu, los cuales son necesarios para las interacciones en el
monómero y, por lo tanto, para su actividad catalítica. Esto tiene como
consecuencia un aumento a la propensión a la oligomerización y a la creación
de agregados de proteínas intraneuronales que conducen a la inhibición del
transporte axonal, interrupción del sistema proteasoma, disfunción neurales y al
estrés del retículo endoplasmático, dando como resultado la muerte neuronal
(Bailey et al., 2017). Esta toxicidad causada por SOD1 y el daño neuronal
26
encaminan la activación de células gliales circundantes, microglía y astrocitos,
lo cual genera neuroinflamación y aumenta la liberación de factores tóxicos
(Stamenkovic et al., 2017).
Dentro de los valores altos de conectividad e intermediación de los
genes implicados en la ELA, cabe destacar la importancia de TARDBP (TAR
DNA binding protein), nodo que aparece con elevado grado e intermediación.
El papel fisiológico de la proteína no se conoce bien del todo, aunque se ha
sugerido que participa en la represión transcripcional, en la biogénesis de
microARN, en el empalme alternativo, así como en la división celular y
apoptosis (Maekawa et al., 2009). Entre las características de las causas
patológicas de la enfermedad, una de ellas sería, pues, la agregación de
proteínas, en concreto proteínas de unión como la TARDBP, la cual se ha
detectado como el principal constituyente de los agregados citoplasmáticos
neuronales y de células gliales (Cykowski et al., 2017). Se han descrito más de
cuarenta mutaciones en el gen TARDBP, y se ha demostrado que contienen
especies de TDP-43 fosforilados y ubiquitinados. La acumulación de TDP-43 es
probablemente mediada por diversos factores como serían: la alteración del
metabolismo de las proteínas, metabolismo del ARN, formación de gránulos de
estrés, neuroinflamación, estrés oxidativo y liberación por parte de los
astrocitos de factores tóxicos. Se ha visto también implicado, como causa de la
formación de dichos agregados, en la interrupción del transporte nuclear,
especialmente en relación con la presencia del gen C9ORF72, así como en las
vías proteolíticas por medio de los sistemas del proteasoma y la autofagia. Se
ha llegado a la hipótesis de que estos agregados podrían ser liberados e
incorporados en células adyacentes, es decir, se propagarían a modo de prion,
los cuales darían lugar a más agregados (Ishii et al., 2017).
En nuestro trabajo también hemos detectado que el gen TP53 (tumor
protein p53) presenta los mayores valores de conectividad e intermediación. Es
bien conocido que TP53 codifica una proteína encargada de suprimir tumores
con dominios de activación transcripcional, oligomerización y unión al ADN
(Rangel et al., 2006). La proteína que codifica dicho gen participa en procesos
biológicos tales como la detención del ciclo celular, la apoptosis, la
senescencia, la reparación del ADN o ciertos cambios metabólicos (Kogan &
27
Carpizo et al., 2016). También se ha relacionado con diversos estados de
disfunción de la telomerasa; en este sentido, se ha visto como en pacientes
con ELA el nivel de expresión de la misma se encontraba reducida, y se
correlacionó con la expresión de ARNm de la proteína p53, indicando la
hipótesis de que la inhibición de la telomerasa podría estar implicado en la
patología de la neurodegeneración en la esclerosis lateral amiotrófica (De
Felice et al., 2014).
Por otro lado, entre las vías que se encuentras relacionadas con el gen
CTNNB1 (catenin beta 1) se sitúa la vía se señalización wnt; las proteínas que
están relacionadas con esta vía pertenecen al grupo de moléculas de
señalización que son secretadas con el objetivo de intervenir en el desarrollo y
regeneración neuromuscular, detectándose en el músculo esquelético, en
neuronas motoras y en las uniones neuromusculares, de ahí que una alteración
o una desregularización causada en esta vía desempeñe un papel importante
en la fisiología de la ELA (McLoon et al., 2014). Se ha estudiado como una
deficiencia en vitamina D encontrada en aquellos pacientes que tienen ELA, la
cual interviene en el regulación del calcio (cuyo aumento intracelular en
neuronas motoras conlleva a la muerte celular en ELA), está vinculada, y afecta
por lo tanto, a esta vía de señalización wnt/β-catenina (Török et al., 2016).
Constituye el segundo gen con mayor valor de intermediación en los resultados
obtenidos.
El gen APOE sería el tercer gen con mayor valor de intermediación,
siendo la proteína codificada por este gen una apoproteína (apolipoprotein E)
esencial para el catabolismo normal de los constituyentes de lipoproteínas ricas
en glicéridos y fundamental tanto para el metabolismo energético como para la
neurodegeranción (Chiò et al., 2016). Existen hasta 3 alelos principales en este
gen (ε3, ε2, ε4), siendo encontrada una asociación entre ELA y el alelo ApoE-
ε2, y que parece relacionarse con un fenotipo protector en trastornos
neurodegenerativos (Albani et at., 2017).
En el estudio de posibles variantes genéticas en ITGA2 que puedan dar
lugar a patologías propias de ELA, no hemos detectado resultados específicos
que indiquen una variación vinculada con la enfermedad. Sin embargo, en los
28
resultados obtenidos en el presente trabajo, este gen es el segundo con mayor
valor de grado y entre sus funciones se incluyen la heterodimerización de
proteínas y unión a la integrina, siendo la proteína (integrina α2/β1) codificada
por este gen, un receptor de laminina, colágeno, colágeno C-propeptidos, E-
cadherina y fibronectina (Penco et al., 2008).
Por último, el gen JUN (Jun proto-oncogene, AP-1 transcription factor
subunit) ocuparía el tercer lugar dentro de los valores significativos de grado;
sin embargo, hasta el momento no se ha podido obtener información
demostrada de cómo está asociado con ELA. AP-1 engloba a un conjunto de
factores transcripción heterodiméricos que están formados por las subunidades
Jun, Fos o ATF, los cuales se unen a un sitio común en el ADN y están
implicados en la participación de diversas funciones como la proliferación
celular y supervivencia celular, así como en regular diferentes genes diana y,
por lo tanto, en llevar a cabo distintas funciones biológicas (Karin et al., 1997).
Una de las enfermedades asociadas con JUN es el sarcoma cerebral, el cual
ha sido clasificado, junto con los tumores neuroectodérmicos primitivos
periféricos, dentro de la misma familia de tumores, al compartir las mismas
propiedades histopatológicas, moleculares e inmunohistoquímicas (Zhang et
al., 2016).
29
6. CONCLUSIONES
Los genes de mayor relevancia localizados en bases de datos y
propuestos como muy implicados en la ELA son C9ORF72, SOD1 y
TARDBP.
De esos tres genes, los dos últimos han sido también detectados como
importantes en nuestros resultados mediante procedimientos de Biología
de Sistemas. En el caso del gen SOD1 al presentar uno de los mayores
valores de intermediación, mientras que para TARDBP como uno de los
genes con mayor grado e intermediación.
Los genes que tienen una mayor intermediación son TP53, CTNNB1,
APOE y, con respecto a aquellos que tienen un mayor grado, destacan
TP53, ITGA2, JUN. Como se ha podido ver, el gen TP53 coincide con
que es el primer gen que tiene un elevado valor, tanto de grado como de
intermediación.
La Biología de Sistemas es una disciplina que nos ha permitido
interpretar la integración de información de diferentes campos del
conocimiento y a partir de la cual se pueden detectar aquellos genes
que tienen una mayor relevancia en enfermedades y ser considerados
como posibles dianas terapéuticas.
30
31
7. BIBLIOGRAFÍA
Aguda BD, Goryachev AB. 2007. From pathways databases to network models
of switching behavior. PLoS Comput Biol. 3: 1674-1678.
Albani D, Pupillo E, Bianchi Elisa, Chierchia A, Martines R, Forloni G, Beghi E.
2017. The role of single-nucleotide variants of the energy APOE in
amyotrophic lateral sclerosis risk. Genes Genet Syst. 91: 301-309.
Babtie A, Kirk P, Stumpf M. 2014. Topological sensitivity analysis for systems
biology Model space. Proc Natl Acad Sci USA. 111: 18507–18512.
Bailey J, Colón A, Atchison W. 2017. Evaluating a Gene-Environment
Interaction in Amyotrophic Lateral Sclerosis: Methylmercury Exposure
and Mutated SOD1. Curr Environ Health Rep. 4: 200-207.
Boccaletti S, Latora V, Moreno Y, Chavez M., Hwang DU. 2006. Complex
networks: Structure and dynamics. Physics Reports. 424: 175-308.
Bonifacino T, Cattaneo L, Gallia E, Puliti A, Melone M, Provenzano F, Bossi S,
Musante I, Usai C, Conti F, Bonanno G, Milanese M. 2017. In-vivo
effects of knocking-down metabotropic glutamate receptor 5 in the
SOD1G93A mouse model of amyotrophic lateral sclerosis.
Neuropharmacology. (In Press)
Chin C, Chen S, Wu H, Ho C, Ko M, Lin C. 2014. cytoHubba: identifying hub
objects and sub-networks from complex interactome. BMC Systems
Biology. 8:S11.
Chiò A, Brunetti M, Barberis M, Iazzolino B, Montuschi A, Ilardi A,
Cammarosano S, Canosa A, Moglia C, Calvo A. 2016. The Role
of APOE in the Occurrence of Frontotemporal Dementia in Amyotrophic
Lateral Sclerosis. JAMA Neurology. 73: 425-430.
Cickovski T, Peake E, Aguiar V, Narasimhan G. 2017. ATria: a novel centrality
algorithm applied to biological networks. BMC Bioinformatics. 18: 239.
32
Corcia P, Couratier P, Blasco H, Andres C.R, Beltran S, Meininger V, Vourc’h
P. 2017. Genetics of amyotrophic lateral sclerosis. Revue Neurologique.
1-9.
Cykowski M, Powell S, Peterson L, Appel J, Rivera, A, Takei H, Chang E, Appel
S. 2017. Clinical Significance of TDP-43 Neuropathology in Amyotrophic
Lateral Sclerosis. Journal of Neuropathology & Experimental Neurology.
76: 402-413.
De Felice B, Annunziata A, Fiorentino G, Manfellotto F, D'Alessandro R, Marino
R, Borra M, Biffali E. 2014. Telomerase expression in amyotrophic lateral
sclerosis (ALS) patients. Journal of Human Genetics. 59: 555-61.
De Las Rivas J, Fontanillo C. 2010. Protein–Protein Interactions Essentials: Key
Concepts to Building and Analyzing Interactome Networks. PLoS
Comput Biol 6: e1000807.
Esanov R, Cabrera G, Andrade N, Gendron T, Brown R, Benatar M, Wahlestedt
C, Mueller C, Zeier Z. 2017. A C9ORF72 BAC mouse model
recapitulates key epigenetic perturbations of ALS/FTD. Molecular
Neurodegeneration. 12: 46.
Franceschini A, Szklarczyk D, Frankild S, Kuhn M, Simonovic M, Roth A, Lin
J, Minguez P, Bork P, von Mering C, Jensen LJ. 2013. STRING v9.1:
protein-protein interaction network, with increased coverage and
integration. Nucleic Acids Research. 41: D808-D815
Ge H, Walhout AJ, Vidal M. 2003. Integrating ‘omic’ information: a bridge
between genomics ans systems biology. Trends Genetics. 19: 551-560.
Hogden A, Foley G, Henderson RD, James N, Aoun SM. 2017. Amyotrophic
lateral sclerosis: improving care with a multidisciplinary approach.
Journal of Multidisciplinary Healthcare. 10: 205-215.
Hood L, Tian Q. 2012. Systems Approaches to Biology and Disease Enable
Translational Systems Medicine. Genomics, Proteomics &
Bioinformatics. 10: 181-185.
33
Ishii T, Kawakami E, Endo K, Misawa H, Watabe K. 2017. Formation and
spreading of TDP-43 aggregates in cultured neuronal and glial cells
demonstrated by time-lapse imaging. PLoS One. 12: e0179375
Ji Z, Yan K, Li W, Hu H, Zhu X. 2017. Mathematical and Computational
Modeling in Complex Biological Systems. BioMed Research
International. 16
Karin M, Liu Zg, Zandi E.1997. AP-1 function and regulation. Current Opinion in
Cell Biology. 9: 240-246.
Kesić S. 2016. Systems biology, emergence and antireductionism. Saudi
Journal of Biological Sciences. 23: 584-591.
Kogan S, Carpizo D. 2016. Pharmacological targeting of mutant p53.
Translational Cancer Research. 5: 698-706.
Liang Y, Kelemen A. 2017. Computacional dynamic approaches for temporal
omics data with applications to systems medicine. BioData Mining. 10:
20
Liu Z, Guo F, Zhang J, Wang J, Lu L, Li D, He F. 2013. Proteome-wide
prediction of self-interacting proteins based on multiple properties.
Molecular & cellular Proteomics. 12: 1689-1700.
Maekawa S, Leigh PN, King A, Jones E, Steele JC, Bodi I, Shaw CE,
Hortobagyi T, Al-Sarraj S. 2009. TDP-43 is consistently co-localized with
ubiquitinated inclusions in sporadic and Guam amyotrophic lateral
sclerosis but not in familial amyotrophic lateral sclerosis with and without
SOD1 mutations. Neuropathology. 29: 672-683.
Mete M, Tang F, Xu X, Yuruk N. 2008. A structural approach for finding
functional modules from large biological networks. BMC Bioinformatics.
9: S19.
McLoon LK, Harandi VM, Brännström T, Andersen PM, Liu J-X. 2014. Wnt and
Extraocular Muscle Sparing in Amyotrophic Lateral
Sclerosis. Investigative Ophthalmology & Visual Science. 55: 5482-5496.
34
Nguyen PV, Srihari S, Leong HW. 2013. Identifying conserved protein
complexes between species by constructing interolog networks. BMC
bioinformatics.14: S8.
Niklinski J, Kretowski A, Moniuszko M, Reszec J, Michalska A, Niemira
M,Ciborowski M, Charkiewicz R, Jurgilewicz D, Kozlowski M, Ramlau R,
Piwkowski C, Kwasniewski M, Kaczmarek M, Ciereszko A, Wasniewski
T, Mroz R, Naumnik W, Sierko E, Paczkowska M, Kisluk J, Sulewska A,
Cybulski A, Mariak Z, Kedra B, Szamatowicz J, Kurzawa P, Minarowski
L, Charkiewicz AE, Mroczko B, Malyszko J, Manegold C, Pilz L, Allgayer
H,Abba ML, Juhl H, Koch F. 2017. Systematic biobanking, novel imaging
techniques, and advanced molecular analysis for precise tumor
diagnosis and therapy: The Polish MOBIT Project. Advances in Medical
Sciences. 62: 405-41
Oliveira AS, Pereira RD. 2009. Amyotrophic lateral sclerosis (ALS): three letters
that change the people's life. For ever. Arquivos De Neuro-Psiquiatria.
67: 750-782.
Pellegrini M, Baglioni M, Geraci F. 2016. Protein complex prediction for large
protein protein interaction networks with the Core&Peel method. BMC
Bioinformatics. 17: 372
Penco S, Buscema M, Patrosso MC, Marocchi A, Grossi E. 2008. New
application of intelligent agents in sporadic amyotrophic lateral sclerosis
identifies unexpected specific genetic background. BMC Bioinformatics.
9: 254.
Rangel A, Piña P, Salcedo M. 2006. Variaciones genéticas del gen supresor de
tumores TP53: relevancia y estrategias de análisis. Revista de
Investigación Clínica. 58: 254-264.
Riancho J, Gonzalo I, Ruiz Soto M, Berciano J. 2016. Why do motor neurons
degenerate? Actualization in the pathogenesis of amyotrophic lateral
sclerosis. Neurología. S0213-4853.
35
Rodríguez de Rivera F. J, Oreja C, Sanz I, San José B, Santiago A, Gómez
MA, Arpa J, Díez E. 2011. Evolución de pacientes con esclerosis lateral
amiotrófica atendidos en una unidad multidisciplinar. Neurología. 26:
455-460.
Sangwan S, Eisenberg DS. 2016. Perspective on SOD1 mediated toxicity in
Amyotrophic Lateral Sclerosis. Postepy Biochem. 62: 362-369.
Saito R, Smoot ME, Ono K, Ruscheinski J, Wang PL, Lotia S, Pico AR, Bader
GD, Ideker T. 2012. A travel guide to Cytoscape plugins. Nature
methods. 9: 1069-1076
Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin
N, Schwikowski B, Ideker T. 2003. Cytoscape: A Software Environment
for Integrated Models of Biomolecular Interaction Networks. Genome
Research. 3: 2498-2504.
Stamenković S, Dučić T, Stamenković V, Kranz A, Andjus PR. 2017. Imaging of
glial cell morphology, SOD1 distribution and elemental composition in the
brainstem and hippocampus of the ALS hSOD1 G93A rat. Neuroscience.
357: 37-55.
Su G, Morris JH, Demchak B, Bader GD. 2014. Biological network exploration
with cytoscape 3. Current Protocols in Bioinformatics. 47: 8.13.1–
8.13.24.
Szklarczyk D, Morris JH, Cook H, Kuhn M, Wyder S, Simonovic M, Santos A,
Doncheva NT, Roth A, Bork P, Jensen LJ,Von C. 2017. The STRING
database in 2017: quality-controlled protein–protein association
networks, made broadly accesible. Nucleic Acids Research. 45: 362-368.
Török N, Török R, Klivényi P, Engelhardt J, Vécsei L. 2016. Investigation of
vitamin D receptor polymorphisms in amyotrophic lateral sclerosis. Acta
Neurologica Scandinavica. 133: 302-308.
Van Damme P, Robberecht W, Van Den Bosch L. 2017. Modelling amyotrophic
lateral sclerosis: progress and possibilities. Disease Models &
Mechanisms. 10: 537-549.
36
Vella D, Zoppis I, Mauri G, Mauri P, Di Silvestre D. 2017. From protein-protein
interactions to protein co-expression networks: a new perspective to
evaluate large-scale proteomic data. EURASIP Journal on Bioinformatics
and Systems Biology. 6.
Voevodski K, Teng SH, Xia Y. 2009. Finding local communities in protein
networks. BMC Bioinformatic. 10: 297.
Volkening k, Strong WL, Seaton S, Yang W, Strong MJ. 2017. C9orf 72
mutations do not influence the tau signature of amyotrophic lateral
sclerosis with cognitive impairment (ALSci). Amyotrophic Lateral
Sclerosis and Frontotemporal Degeneration. 31: 1-6.
Wiener, N. 1948. Cibernética o el control y comunicación en animales y
máquinas. Tusquets Ed.
You L. 2004. Toward Computational Systems Biology. Cell Biochemistry and
Biophysics. Cell Biochemistry and Biophysics. 40: 167-184.
Yu W, Clyne M, Khoury MJ, Gwinn M. 2010. Phenopedia and Genopedia:
disease-centered and gene-centered views of the evolving knowledge of
human genetic associations. Bioinformatics. 26: 145-146.
Zhang Y, Li H, Li Z, Liu M, Yang L, Fan L, Huang C, Li B. 2016. Synthetic
treatment of intracranial peripheral primitive neuroectodermal tumor with
multiple metastasis: a case report. OncoTargets and Therapy. 9: 3327-
3333.