Post on 21-Jul-2020
Pág.47
UNIVERSIDAD DE CÓRDOBA Facultad de Ciencias
Grado de Bioquímica
Trabajo Fin de Grado
Análisis e integración de datos -ómicos y su aplicación a la
investigación en encina Código del TFG: BQ17-16-BBM Tipología: Inicio a la investigación
Autor: Jesús Miguel Pérez Gómez
07/09/2018
(Quercus ilex)
pág. 2
Agradecimientos
Este trabajo pone broche a una etapa de aprendizaje continuo, tanto a nivel formativo como
personal, la cual sería imposible sin aquellas personas que me han ayudado y apoyado día
tras día.
En primer lugar, agradecer a la Fundación Torres Gutiérrez por la financiación, que ha
contribuido al desarrollo del trabajo aquí expuesto.
Agradecer a mis tutores Jesús y Rosa, por guiarme a lo largo de este proyecto. Por su
motivación para superarme y por brindarme sus consejos y conocimientos, que trascienden
este trabajo y me serán de utilidad en mi futuro profesional.
Especial mención a Lola, que me ha demostrado su entregada dedicación, por su absoluta
disponibilidad y por ofrecerme su ayuda en todo momento.
Agradecer también a Víctor, ya que sin su ayuda este trabajo no hubiera salido adelante.
También agradecer a Mari Ángeles, Ana, Mari Carmen, Conchi, Cristina, Isabel, Macedonia,
Manolo, Silvia, Kamilla y muchos más, que han formado parte de este laboratorio en los
últimos tres años.
A Félix, por facilitarnos aquello de lo que carecíamos en nuestro laboratorio y por su ayuda
desinteresada.
Y, por último, agradecer a los tres apoyos fundamentales de mi vida, mis padres y mi
hermano, por alentarme a dar la mejor versión de mí, por aguantarme en mis peores
momentos y por ser un apoyo incondicional.
pág. 3
Índice general
Índice de Ilustraciones ........................................................................................................................ 4
Índice de tablas ................................................................................................................................... 4
Resumen .............................................................................................................................................. 5
Abstract ............................................................................................................................................... 6
Introducción ........................................................................................................................................ 7
Materiales y métodos ....................................................................................................................... 12
1. Material vegetal ........................................................................................................................ 12
2. Tratamiento de sequía y muestreo ........................................................................................... 12
3. Extracción de RNA ..................................................................................................................... 13
4. Estimación de la cantidad y la calidad del RNA ......................................................................... 13
5. RNA-Seq ..................................................................................................................................... 14
6. Análisis de datos de RNA-Seq .................................................................................................... 14
Resultados y discusión ...................................................................................................................... 15
1. Inspección visual de daños, contenido hídrico y fluorescencia de hojas .................................. 15
2. Control de calidad de las secuencias ......................................................................................... 17
3. Análisis de expresión diferencial ............................................................................................... 18
4. Comparación entre tiempos. Análisis de términos de Ontología Génica ................................. 29
5. Integración de resultados: transcriptómica y proteómica ........................................................ 31
Conclusiones ..................................................................................................................................... 34
Conclusions ....................................................................................................................................... 35
Bibliografía ........................................................................................................................................ 36
Anexo ................................................................................................................................................ 41
pág. 4
Índice de Ilustraciones
Ilustración 1. Número de publicaciones en PubMed desde 1990 relacionadas con RNA-Seq y Microarrays ………………………………………………………………………………………………………………………..10 Ilustración 2. Flujo de trabajo en un experimento de transcriptómica con una estrategia de RNA-Seq ……………………………………………………………………………………………………………………………..11 Ilustración 3. Inspección visual de daños y medida de fluorescencia ………………………………….16 Ilustración 4. Análisis de calidad de las secuencia ………………………………………………………………18 Ilustración 5. Número de genes con expresión diferencial en respuesta a sequía……………….19 Ilustración 6. Representación gráfica MA de los transcritos diferencialmente expresados a los 20 días……………………………………………………………………………………………………………………………20 Ilustración 7. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 20 días…………………………………………………………………………………………………………………….....20 Ilustración 8. Representación gráfica MDS de las muestras a los 20 días……………………………………………………………………………………………………………………….…………….21 Ilustración 9. Categorización funcional de los transcritos expresados diferencialmente a los 20 días…………………………………………………………………………………………………………….…………………..21 Ilustración 10. Representación gráfica MA de los transcritos diferencialmente expresados a los 25 días………………………………………………………………………………………….………………………………..24 Ilustración 11. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 25 días……………………………………………………………………………………………….……..24 Ilustración 12. Representación gráfica MDS de las muestras a los 25 días…………………………..25 Ilustración 13. Categorización funcional de los transcritos expresados diferencialmente a los 25 días…………………………………………………………………………………………………………………………………25 Ilustración 14. Grupos funcionales identificados en el estudio proteómico………………………..32 Ilustración 15. Ontología Génica de las funciones moleculares…………………………………………..47 Ilustración 16. Ontología Génica de los procesos biológicos……………………………………………….48 Ilustración 17. Ontología Génica de los componentes celulares………………………………………….49
Índice de Tablas Tabla 1. Parámetros de calidad de las lecturas originales y procesadas………………………………17 Tabla 2. Valores de RIN de las preparaciones de RNA………………………………………………………….41 Tabla 3. Genes con expresión diferencial a los 20 días del ensayo………………………………………42 Tabla 4. Genes con expresión diferencial a los 25 días del ensayo………………………………………43 Tabla 5. Comparación de los datos generados por las aproximaciones de transcriptómica y proteómica………………………………………………………………………………………………………………………….33
pág. 5
Resumen
El presente trabajo tiene por objetivo el estudio a nivel fisiológico y molecular de la
respuesta a sequía en Q. ilex. Se llevó a cabo con plántulas de 6 meses de edad. El
tratamiento de sequía se impuso por la eliminación por completo del riego durante 25 días.
Las consecuencias y la respuesta a dicho estrés se evaluaron mediante la inspección de
visual daños, contenido hídrico en hojas y raíces, y la fluorescencia en hojas.
En el periodo de ensayo no se observaron síntomas de daños por sequía, ni diferencias
significativas entre control y tratamiento en el contenido hídrico, confirmando así el carácter
tolerante de esta especie. Los valores de fluorescencia se vieron reducidos un 30 % y 50 % a
los 20 y 25 días del ensayo, respectivamente. Mediante transcriptómica, utilizando la
plataforma HiSeq 4000 PE100 lane (Illumina) se llevó a cabo el análisis de expresión
diferencial de genes a los 20 y 25 días. El número de transcritos diferenciales identificados
fue de, respectivamente, 14 y 90 para cada uno de los tiempos. La respuesta a sequía se
caracterizó por un aumento en la abundancia de transcritos de genes de respuesta a estrés,
incluyendo sistemas enzimáticos de detoxificación de especies reactivas de oxígeno y
proteínas de respuesta a choque térmico, genes ribosomales y genes de enzimas de las rutas
metabólicas de carbohidratos y aminoácidos. Los datos así generados se integraron con los
obtenidos mediante técnicas proteómicas, proporcionando una visión holística de la
respuesta a sequía. Los datos de transcriptómica a nivel de grupos funcionales se
correlacionaron con los datos proteómicos publicados por Papa (2018).
Palabras clave: Quercus ilex; Sequía; Transcriptómica; Proteómica; Integración -ómica
pág. 6
Abstract
The main objective of this TFG is to study the response to drought in Q. ilex from a
physiological and molecular point of view. The experiments were carried out using 6-month
plants. The plants were subjected to a severe water deficit for 25 days. The consequences
and responses to drought were evaluated by typical symptoms of stress (chlorosis and
water-soaked lesions), relative water content both in leaves and roots, and fluorescence
emitted by leaves.
Neither symptoms of stress nor differences in the relative water content were
observed, indicating that Q. ilex is highly tolerant against drought. The fluorescence values
were reduced by 30 % and 50 % at 20 and 25 days, respectively. A differential expression
analysis of genes involved in response to drought at 20 and 25 days was carried out using
the HiSeq 4000 PE100 lane (Illumina) platform by a RNA-Seq analysis. A total of 14 and 90
differential transcripts was identified at each of both times, respectively. The drought
response was characterized by an increase in the number of transcripts related to plant
stress, including enzymatic systems for the detoxification of reactive oxygen species and
heat-shock proteins, ribosomal genes, and genes involved in the carbohydrate and amino
acid metabolism. All these data were integrated with data previously obtained by a
proteomic approach, giving a holistic view of the response to experimental drought
conditions in Q. ilex. The transcriptome data at functional group level were correlated to
proteomic data previously published by Papa (2018).
Keywords: Quercus ilex; Drought; Transcriptomics; Proteomics; -Omics integration
pág. 7
Introducción
En la introducción del presente Trabajo Fin de Grado (TFG) haremos referencia a los
tres elementos básicos en que definen un proyecto de investigación: el sistema
experimental, los objetivos e hipótesis de partida y la aproximación metodológica, quedando
todos ellos definidos en el propio título “Análisis e integración de datos -ómicos y su
aplicación a la investigación en encina (Quercus ilex)”.
La encina (Q. ilex L. subsp ballota [Desf.] Samp.) es la especie predominante del
ecosistema agrosilvopastoral andaluz, la dehesa, y del bosque mediterráneo (Cañellas et al.,
2007; Pasta et al., 2016). La encina es una parte importante del patrimonio medioambiental
de Andalucía, con una superficie de 981.431 ha y una gran importancia ecológica, social y
económica, siendo considerada como el Árbol Nacional de España (Moro, 2002). Desde el
Imperio Romano ha jugado un papel destacado en la vida y subsistencia del hombre
mediterráneo, utilizándose como fuente de madera para construcciones, combustible y
alimento. Su fruto, la bellota, es el producto de mayor valor, fuente de alimento del cerdo y
lo que da calidad a los productos obtenidos del mismo, jamón y embutidos (Cañellas et al.,
2007).
La encina presenta características de especie esclerófila, como hojas pequeñas y
coriáceas, adaptaciones que le permiten tolerar situaciones de sequía y altas temperaturas
(Pasta et al., 2016). Además, a diferencia de otras especies similares, como Q. humilis, la
encina también posee una elevada resistencia al frío (Braitenberg & Schüz, 1998), lo que le
ha permitido sobrevivir y ser dominante en climas continentales con inviernos fríos y largos y
calurosos veranos.
En la actualidad, la sostenibilidad y supervivencia de Q. ilex se ve amenazada por una
serie de factores entre los que se encuentran árboles envejecidos, sobreexplotación
(pastoreo) y, sobre todo estreses tanto abióticos como bióticos, en especial sequía y
Phytophthora cinnamomi; todos ellos, en conjunto, contribuyen, en mayor o menor medida,
al denominado síndrome de la seca, con focos de mortandad de árboles cada vez más
extendidos (Jorge et al., 2006; Echevarría-Zomeño et al., 2009; Valero-Galván et al., 2011,
Sghaier-Hammami et al., 2013;). La situación puede verse agravada en un escenario de un
inminente cambio climático, con unas previsiones que estiman un incremento de la
temperatura media en las regiones del mediterráneo de 4-5 °C para el año 2100 (Lindner et
al., 2010). Ante esta situación de alarma, que ha transcendido el sector productivo y
científico-técnico, urge la toma de ciertas medidas (González, 2008; http://www.ipcc.ch).
pág. 8
Actualmente, debido a la preocupante situación en la que se encuentra la encina, numerosas
noticias han sido publicadas en varios periódicos nacionales para llamar la atención de la
sociedad, como por ejemplo el artículo publicado en el País el día 15/05/2018 titulado “Una
encina tarda 40 años en florecer; este hongo (P. cinnamomi) la puede secar en días”
(https://elpais.com/politica/2018/05/15/actualidad/1526406969_811389.html), o el
publicado en el Diario de Córdoba el día 04/06/2018 titulado “La Junta destina 30,5 millones
a renovar el arbolado de la dehesa”
(http://www.diariocordoba.com/noticias/cordobalocal/junta-destina-30-5-millones-renovar-
arbolado-dehesa_1230194.html). A este respecto, la Biotecnología Vegetal puede jugar un
papel importante.
En este contexto, la línea de trabajo llevada a cabo por el Grupo de Investigación
“Bioquímica, Proteómica y Biología de Sistemas Vegetal y Agroforestal” (AGR-164) está
enfocada al estudio de diferentes aspectos de la biología de Q. ilex que van desde los
puramente fisiológicos, a aproximaciones moleculares, combinando bioquímica clásica con
diferentes aproximaciones -ómicas (transcriptómica, proteómica y metabolómica)
(Echevarría-Zomeño et al., 2009, 2012; Jorrín-Novo et al., 2009; Valero-Galván et al., 2011,
2012; Sghaier-Hammami et al., 2013, 2016; Romero-Rodríguez et al., 2014; Guerrero-
Sanchez et al., 2017; López-Hidalgo et al., 2018). A partir de la propia experiencia del grupo
de investigación en trabajos llevados a cabo en Q. ilex, se conoce la extrema complejidad
presentada en esta especie forestal debido a sus características biológicas, con ciclo de vida
largo, carácter alógamo, y a su naturaleza recalcitrante. Es por ello, y como ocurre en la
mayoría de las especies forestales, los programas de mejora genética clásica no son viables y
la ingeniería genética no es factible ni aceptada dentro de la UE. La única alternativa posible
es la explotación de la biodiversidad, lo que implica, como paso previo, la caracterización de
la misma a nivel macroscópico, microscópico y molecular, y el análisis a nivel morfológico,
fenológico, fisiológico y molecular, incluyendo las modernas aproximaciones –ómicas. El
objetivo final sería la identificación de árboles “élites” o “plus” con características fenotípicas
determinadas basadas en marcadores moleculares.
El presente TFG tiene por objetivo la utilización de la transcriptómica en la
caracterización de la respuesta y tolerancia a sequía en Q. ilex, utilizando para ello la
tecnología NSG (del inglés Next Genome Sequencing), en concreto el RNA-Seq mediante la
plataforma HiSeq 4000 PE100 lane (Illumina). Se basa en la comparación del perfil de
transcritos en hojas de plantas con y sin estrés por sequía. Los datos resultantes se
pág. 9
compararán con aquellos obtenidos mediante una aproximación de proteómica (Papa,
2018).
La palabra transcriptoma fue usada por primera vez en 1995 (Velculescu et al., 1997).
Desde ese momento se ha vivido una verdadera revolución que ha hecho de la
transcriptómica un campo muy amplio y complejo. Este rápido avance está ligado y dirigido
por el desarrollo de las denominadas nuevas tecnologías de secuenciación masiva, con la
mejora de su sensibilidad y la gran disminución de sus precios (Lowe et al., 2017). Las
tecnologías transcriptómicas son aquellas usadas para el estudio del transcriptoma, el
conjunto de todos los transcritos presentes en un sistema biológico (orgánulo, célula, tejido,
órgano, individuo, especie o ecosistema), en cualquier etapa de desarrollo y bajo
condiciones ambientales específicas (Lowe et al., 2017). La información de un organismo
está grabada en el DNA, y se expresa por medio de la transcripción. El RNA mensajero
(mRNA) sirve como molécula intermediaria de información en el dogma central de la
biología molecular, actuando como nexo entre el genoma y el proteoma de una especie. Los
objetivos de la transcriptómica son (1) identificar y catalogar todas las especies de
transcriptos, incluyendo mRNAs, RNAs no codificantes (tRNA, rRNA, lncRNA, etc.) y RNAs
pequeños (siRNAs, miRNAs y piRNAs); (2) determinar las estructuras transcripcionales de los
genes, en cuanto a sus sitios definidos 5' y 3' de inicio y fin; (3) identificar los patrones de
ayuste (o en inglés “splicing”) y otras modificaciones post-transcripcionales; y (5) cuantificar
los cambios en los niveles de expresión de cada transcripto durante las distintas fases del
desarrollo y bajo diferentes condiciones (Wang et al., 2001).
Las librerías de EST (acrónimo del inglés Expressed Sequence Tag o marcador de
secuencia expresada) basadas en retrotranscripción a DNA complementario (cDNA) y
secuenciación Sanger junto con el posterior desarrollo de la metodología “por etiquetas”
gracias a las técnicas SAGE/CAGE (acrónimo del inglés Serial and Cap analysis of gene
expression, repectivamente) y MPSS (acrónimo del inglés Massively Parallel Signature) en
combinación con los métodos de secuenciación por síntesis (Solexa/Illumina, San Diego, CA)
fueron los precursores de la transcriptómica actual (Lowe et al., 2017). Actualmente, junto
con un análisis de RNA-Seq, los microarrays son las técnicas predominantes en el campo de
la transcriptómica (Lowe et al., 2017). Brevemente, los microarrays miden la abundancia de
hasta miles de transcritos por su hibridación en una placa, previamente diseñada con sondas
específicas de DNA. Hay dos tipos principales de microarrays transcriptómicos, los
coloreados (o en inglés “spotted”) o los de síntesis in situ (Affymetrix GeneChip®
pág. 10
Microarrays). Ambos cuantifican los transcriptos por detección de fluorescencia. Por su
parte, el RNA-Seq hace referencia a la secuenciación de los transcritos, en forma de cDNA de
una muestra biológica. De la secuenciación se generan lecturas (secuencia ordenada de
nucleótidos o de sus probabilidades inferidas de un fragmento de DNA), y a partir de éstas se
puede cuantificar la expresión del transcrito. Pese a que los microarrays fueran
predominantes entre los años 2008 – 2012, ha habido un cambio de tendencia que sitúan al
RNA-Seq por delante en el número de publicaciones en la actualidad (Ilustración 1). Factores
como la cantidad de RNA necesaria de partida (ng en RNA-Seq y mg en microarrays), la
sensibilidad y un rango dinámico hasta dos órdenes de magnitud superior, dan la ventaja al
RNA-Seq frente a los microarrays (Lowe et al., 2017). Además, otra de las ventajas que
ofrece el RNA-Seq es que no requiere del conocimiento previo del genoma del organismo,
mientras que un microarray exige el diseño de la placa con sondas específicas de DNA para
el desarrollo del set de transcritos que se quiera identificar. Por lo tanto, un análisis de RNA-
Seq es una herramienta muy útil a la hora de identificar transcritos relacionados con la
tolerancia a condiciones de estrés hídrico ya que el genoma de Q. ilex no está, actualmente,
secuenciado.
Ilustración 1. Número de publicaciones en PubMed desde 1990 relacionadas con RNA-Seq y Microarrays. En azul el número corresponde a la búsqueda del término “RNA-Seq” y en rojo “RNA microarrays”. (http://dan.corlan.net/medline-trend.html. Consultado el: 19/07/2018)
Los estudios del transcriptoma mediante RNA-Seq, en su sentido más amplio e
integrado, permiten dilucidar la tendencia coordinada del sistema, lo que se convierte en su
mayor ventaja frente a otros ensayos dirigidos a un número concreto de dianas génicas. Así,
esta tecnología resulta de especial interés en su aplicación a la caracterización de perfiles
patogénicos; en el estudio del transcriptoma en diferentes condiciones ambientales; en la
anotación e identificación de genes responsables de un fenotipo, especialmente en
0
1000
2000
3000
4000
Nº
de
pu
blic
acio
ne
s
Año
pág. 11
organismos no modelo; estudio de isoformas de ayuste; identificación de polimorfismos de
un sólo nucleótido (o SNP por sus siglas en inglés; Single Nucleotide Polymorphism); e incluso
en el estudio de los RNAs no codificantes (por ejemplo, RNA pequeño de interferencia (o
siRNA por sus siglas en inglés: small interfering RNA; micro-RNA (o miRNAs), entre otros)
(Wang et al., 2001).
En cuanto al flujo de trabajo para un análisis de RNA-Seq, éste consta de varias
etapas fundamentales representadas en la Ilustración 2. A su vez, el proceso de análisis
bioinformático de los resultados suele también incluir una etapa de control de calidad de las
secuencias, alineamiento frente al genoma en el caso de las especies cuyo genoma esté
secuenciado o a un transcriptoma de novo en el caso de las especies sin genoma
secuenciado, cuantificación de los transcritos y estudios de expresión diferencial (Lowe et
al., 2017).
Ilustración 2. Flujo de trabajo en un experimento de transcriptómica con una estrategia de RNA-Seq. Aparecen representadas las siguientes etapas: (1) diseño experimental y muestreo, (2) extracción del RNA, (3) cuantificación y comprobación de parámetros de calidad, (4) conversión a cDNA y fragmentación, (5) secuenciación, (6) análisis bioinformático de las secuencias obtenidas, y (7) validación e interpretación biológica de los resultados.
Por tanto, este TFG ha tenido principalmente dos objetivos generales bien definidos:
el primero ha consistido en estudiar la respuesta molecular de plántulas de Q. ilex frente a
estrés hídrico severo mediante un análisis transcriptómico. Para ello, se ha llevado una
estrategia de transcriptómica basa en un análisis de RNA-Seq. Los datos se compararán con
los previamente obtenidos mediante proteómica (Papa, 2018). Una vez identificados los
transcritos diferenciales (tratamiento control y de sequía), éstos se agruparán
funcionalmente, proponiéndose qué genes y mecanismos están implicados en la respuesta y
tolerancia a sequía. Aparte del objetivo científico, el TFG ha supuesto, desde un punto de
vista académico y formativo, un excelente método de aprendizaje e inicio en la
investigación, el trabajo técnico en el laboratorio, la búsqueda de información y diseño de
pág. 12
experimentos, la interpretación y discusión de los resultados, y la preparación de un
manuscrito científico.
Materiales y métodos
1. Material vegetal
Las bellotas fueron suministradas por la Red de Viveros de Andalucía y se recogieron
de 10 árboles de la población “Almadén de la Plata” (Sevilla; 37° 52´N 6° 28´W).
Las bellotas fueron seleccionadas y esterilizadas según Bonner & Vozzo, 1987. Para
su limpieza y eliminación de los frutos dañados, estos se sumergieron en agua, eliminado las
que flotaban (frutos avellanados o con picaduras de insectos). La esterilización se llevó a
cabo mediante un lavado con una solución de hipoclorito de sodio al 2,5 % (v/v),
conteniendo unas gotas de Tween-20, durante 20 minutos a temperatura ambiente.
Finalmente, se lavaron con abundante agua, se secaron a temperatura ambiente y se
almacenaron en bolsas de polietileno herméticamente cerradas a 4 °C hasta su utilización
(Caliskan, 2014)
Para que la germinación fuera homogénea y sincronizada, se eliminó el pericarpo y la
porción distal (respecto al embrión) de las semillas. Las semillas se dispusieron, con el
embrión hacia abajo, en macetas de 0,5 L con perlita, como sustrato. La germinación y
crecimiento de las plántulas se llevó a cabo en el invernadero, durante los meses de
diciembre-mayo. Las plantas se regaron a capacidad de campo con agua corriente cada dos
días y una vez a la semana con solución nutritiva (macronutrientes FOLEN 8-8-8 (Solem) y
micronutrientes Microplus Fertiberia Jardín (Hoagland & Arnon, 1950)).
2. Tratamiento de sequía y muestreo
El experimento de sequía fue llevado a cabo en el invernadero, bajo luz natural,
durante el mes de junio de 2017, cuando las plantas tenían 6 meses, presentando 10 hojas y
una altura media de tallo media de 9 cm (Ilustración 3). La temperatura máxima fue de
44/19 °C (día/noche) y la humedad relativa del 30-60 %. El estrés hídrico se impuso
eliminando totalmente el riego, mientras que los plantones control se regaron a capacidad
de campo dos veces por semana con agua y una con solución nutritiva. La duración del
experimento fue de 25 días.
pág. 13
La aparición de síntomas de daño (clorosis, marchitez, muerte) se siguió visualmente,
determinándose en hojas el contenido hídrico relativo y la fluorescencia. El procedimiento
fue el descrito por Gómez-Gálvez (2017) y Papa (2018).
Se recolectaron hojas fotosintéticamente activas a los 20 y 25 días de tratamiento,
considerados como los tiempos 1 (T1) y 2 (T2) de aquí en adelante. La elección de estos días
fue en base a la caída de la actividad fotosintética, con 30 % para T1 y un 50 % para T2. Las
hojas recolectadas se lavaron con agua, se secaron en papel de filtro y se congelaron en
nitrógeno líquido. El tejido se pulverizó en un mortero en presencia de nitrógeno líquido,
almacenándose a -80 oC hasta su extracción.
3. Extracción de RNA
Para la extracción de RNA se utilizaron 50 mg de polvo congelado, utilizándose el kit
InviTrap® Spin Plant RNA Mini kit (Invitek, Berlín, Alemania) y siguiendo el protocolo descrito
previamente por Echevarría-Zomeño et al., (2012), con algunas modificaciones. El
procedimiento se puede resumir en una serie de etapas elementales: (1) homogeneización
del tejido vegetal en buffer de lisis. Para mejorar la calidad del RNA extraído, al buffer de lisis
se añadió 20 mg/ml de polivinilpolipirrolidona (PVPP, 110 µm Sigma), ya que es insoluble en
agua y capaz de unirse a taninos, fenoles y polisacáridos (muy abundantes en las hojas de Q.
ilex) estableciendo puentes de hidrógeno. (2) Eliminación de restos celulares por
centrifugación en columna, (3) dilución del eluido con etanol 96 %, (4) retención del RNA en
columna de afinidad por centrifugación, (5) lavados repetidos de la columna con distintos
buffers, (6) digestión con DNAsa (no incluida en el kit; se empleó una desoxirribonucleasa I
de 20.000 unidades de actividad enzimática a 177,7 U/µl - Invitrogen, Karlsruhe, Alemania).
(7) Elución del RNA retenido.
De los 30 µl finales de eluido de RNA, se tomaron 2 µl para la cuantificación, y 2 µl
para la estimación de la calidad. Los 26 µl restantes de todas las muestras se almacenaron a
-80 °C hasta su envío a la compañía para llevar a cabo el análisis del RNA-Seq.
4. Estimación de la cantidad y la calidad del RNA
La cuantificación del RNA se llevó a cabo por espectrometría (NanoDrop™
2000/2000c). La calidad e integridad del RNA extraído se comprobó electroforéticamente
(bioanalizador Agilent 2100), determinándose el valor de RIN. Dicho análisis se llevó a cabo
pág. 14
en el Servicio Central de Apoyo a la Investigación-SCAI, de la Universidad de Córdoba. Se
seleccionaron aquellas muestras con un RIN ≥ a 7 para el análisis del RNA-Seq.
5. RNA-Seq
Las 12 alícuotas de RNA (2 tratamientos (control/sequía) x 2 tiempos (tiempo inicial y
tiempo final) x 3 réplicas) fueron enviadas a la compañía Allgenetics & Biology (A Coruña,
Galicia, España) para llevar a cabo el RNA-Seq. Una vez recibido, se volvió a cuantificar y a
estimar su calidad en el bioanalizador Agilent 2100 (Agilent RNA 6000 kit), para comprobar
que este no había sufrido degradación (Tabla 2).
Se empleó el kit TruSeq Stranded mRNA Library Prep de Illumina con el protocolo
“low sample” (LS) para preparar las librerías de cDNA. A su vez, el desarrollo de este kit
puede dividirse en una serie de etapas fundamentales: (1) purificación del mRNA mediante
oligonucleótidos poli-T unidos a bolas magnéticas, (2) fragmentación del mRNA por cationes
divalentes a elevada temperatura, (3) síntesis de la primera cadena de cDNA, (4) síntesis de
la segunda cadena de cDNA, (5) adenilación de los extremos 3’, (6) ligación de los
adaptadores, (7) enriquecimiento de los fragmentos de DNA mediante PCR, (8) validación de
la librerías, y (9) normalización y agrupación de librerías, cuantificando mediante Qubit
dsDNA HS Assay Kit (Thermo Fisher Scientific, Somerset, NJ, USA.) (Hou et al., 2015).
6. Análisis de datos de RNA-Seq
Se llevó a cabo un control de calidad de las lecturas sin procesar de todos los
tratamientos, utilizando la herramienta bioinformática FastQC
(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/).
Se observó que las lecturas poseían distintas secuencias sobrerrepresentadas en cada
uno de los archivos pareados, correspondientes a los adaptadores Truseq Adapter Index 7
(ATCGGAAGAGCACACGTCTGAACTCCAGTCACCGGCTATGATCTCGTATG) e Illumina Single End
PCR Primer 1 (ATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGGCTATAGTGTAGATCTC).
Dichos adaptadores, fueron eliminados de las lecturas mediante el programa de
procesamiento de lecturas FastX Toolkit
(http://hannonlab.cshl.edu/fastx_toolkit/index.html).
La causa de este error está originada en el paso del método de iniciación o cebado al
azar (en inglés random priming) en el proceso de construcción de la librería para la
secuenciación. El método de iniciación al azar debería ser dirigido por la selección de
pág. 15
hexámeros aleatorios los cuales en teoría deberían estar presentes en la misma frecuencia
en el mix de cebadores y, también, deberían tener la misma eficiencia. No obstante, esto no
es así en la práctica pues ciertos hexámeros están más favorecidos durante el paso de
imprimación (o en inglés priming) (Hansen et al., 2010).
También se eliminaron las 12 primeras bases de cada lectura debido a la no
proporcionalidad del contenido de bases en esas posiciones de acuerdo con FastQC. Este es
un error común en la secuenciación Illumina y para corregirlo se empleó de nuevo FastX
Toolkit.
Las lecturas ya limpias, fueron alineadas frente al transcriptoma de referencia de
encina, publicado previamente por nuestro grupo de investigación (Guerrero-Sánchez et al.,
2017), utilizando el software Kallisto (https://pachterlab.github.io/kallisto/download). Como
resultado, se obtiene un fichero con la abundancia de expresión de cada transcrito,
expresada en TPM (del inglés Transcripts Per Million).
La relación entre las dos condiciones experimentales de los valores medios de TPM,
permitió obtener los valores de fold change para cada transcrito (expresado como log2). Los
resultados de expresión fueron analizados estadísticamente mediante el paquete Limma del
lenguaje de programación R (False Discovery Rate (FDR) < 0,05) (Ritchie et al., 2015). Se
seleccionaron como expresados diferencialmente aquellos que presentaban unos niveles de
fold change de ±2 respecto a los controles.
Resultados y discusión
1. Inspección visual de daños, contenido hídrico y fluorescencia de hojas
En el género Quercus hay muchas especies que han desarrollado mecanismos de
tolerancia al estrés hídrico (Aranda et al., 2014). Estos mecanismos han sido muy estudiados
a nivel morfológico y fisiológico, siendo muy escasos a nivel molecular. La respuesta a
condiciones de estrés hídrico (o tolerancia a sequía) se evaluó visualmente atendiendo a la
aparición de síntomas de daño, mediante el contenido hídrico en raíces y hojas, y por
cantidad de fluorescencia emitida por las hojas. Durante los 25 días que duró el
experimento, no se observaron síntomas claros de daños por sequía tales como la marchitez,
caída y clorosis de las hojas (Ilustración 3A). Esto corrobora la tolerancia a sequía
previamente descrita en Q. ilex por nuestro grupo de investigación, donde se comparó la
dicha tolerancia entre especies del género Quercus y dentro de la especie Q. ilex (Gómez-
Gálvez, 2017). El contenido hídrico relativo no mostró diferencias significativas entre control
pág. 16
y tratamiento (p = 0.1396 en raíces y p = 0.2721 en hojas), siendo los valores medios
estimados de 48.83 % (hoja control), 67.08 % (raíz control), 54.44 % (hoja sequía) y 48.72 %
(raíz sequía). Las plantas permanecieron bien hidratas en condiciones de sequía, lo que
indica la existencia de un mecanismo de tolerancia a dicho estrés. Este hecho podría estar
asociado al cierre estomático, que disminuya o evite la evapotranspiración (Peguero-Pina et
al., 2018). Los valores de fluorescencia en las hojas es un parámetro de medida de la
actividad del fotosistema II (PSII), siendo muy utilizado en estudios de respuesta a estrés
(Rohácêk, 2002). Los valores de fluorescencia (Fv/Fm) de las plantas sometidas a sequía
fueron, a partir del día 11, inferiores a los de las plantas control, observándose, en las
primera una caída continua desde 0,7 a 0,4 (Ilustración 3B). La caída de la fotosíntesis fue
más acusadas en especies del género Quercus más susceptibles a sequía, casos de, Q. cerris,
Q. frainetto y Q. pyrenaica (Manes et al., 2006; Gómez-Gálvez, 2017).
Ilustración 3. Inspección visual de daños y medida de fluorescencia de A) Imagen de la izquierda corresponde a plantas controles e imagen de la derecha corresponde a plantas sometidas a estrés hídrico de Q. ilex tras 25 días de ensayo. B) Fluorescencia de las hojas. Los valores son media de 3 réplicas. Se indica con * las diferencias significativas (ANOVA, p<0,05).
pág. 17
2. Control de calidad de las secuencias
Se llevó a cabo un análisis transcriptómico comparativo entre muestras de hojas
procedentes de plantas control y sometidas a sequía por ausencia de riego, a dos tiempos,
20 y 25 días, cuando la fluorescencia de las hojas cayó a un 30 y 50 %. Se utilizó tecnología
NGS, en concreto, HiSeq 4000 PE100 lane (Illumina). Esta es una técnica no exenta de
artefactos o errores en las lecturas que pueden originar pequeñas inserciones o deleciones,
baja calidad en algunas lecturas o contaminación por cebadores y adaptadores, lo cual
puede afectar al posterior procesamiento y análisis de los datos generados. Es, por ello,
imprescindible realizar sobre las lecturas recibidas un control de calidad previo a cualquier
estudio de los datos generados. Dicho control de calidad se llevó a cabo utilizando la
herramienta FastQC, la cual proporciona diferentes parámetros para evaluar la calidad de las
lecturas. El informe generado contiene datos estadísticos básicos sobre los archivos
cargados, como número total de secuencias, longitud y contenido GC de las mismas, además
de distintas gráficas con parámetros de calidad, presencia o ausencia de secuencias
sobrerrepresentadas, o contenido de adaptadores empleados por distintos sistemas de
secuenciación (Tabla 1; Ilustración 4). De cada una de las 12 muestras analizadas se ha
obtenido un total de 18 millones de lecturas, aproximadamente, con una longitud y
contenido GC medio de 150 pb y 46 %, respectivamente. (Los datos pertenecen a una
muestra control del segundo tiempo del ensayo, tomada como ejemplo).
Tabla 1. Parámetros de calidad de las lecturas originales y procesadas.
Medidas Secuencia original Secuencia procesada
Secuencias totales 17799939 14457838
Longitud de las secuencias 150 138
% GC 46 44
En cuanto a la gráfica de calidad por bases de las secuencias se muestra una
disminución en la calidad tanto de las primeras como de las últimas bases de las lecturas,
con un valor cercano a 30 (Ilustración 4A). El “score” asignado está basado en la puntuación
de calidad Phred, que define su valor como una propiedad que está relacionada
logarítmicamente con la probabilidad de error al asignar una base en una determinada
posición de una lectura.
Así, en la Ilustración 4A se aprecia como las bases que ocupan una posición
intermedia en las secuencias (entre las bases 10 y 80, aproximadamente) presentan los
pág. 18
mejores resultados para Q, con un valor cercano a 40, lo que significa que las base que hay
en esas posiciones están determinadas con una precisión del 99,99 %. Además de esto, se
encontraron secuencias sobrerrepresentadas, duplicadas y pertenecientes a adaptadores
universales de Illumina.
Teniendo en cuenta estos datos preliminares, se empleó el conjunto de herramientas
FastX Toolkit para procesar las lecturas, presentando diferencias en los resultados obtenidos
respecto a las lecturas iniciales (Ilustración 4B).
Ilustración 4. Análisis de calidad de las secuencias. A) Secuencia original. B) Secuencia procesada con FastX Toolkit. La línea central roja representa la mediana, la caja amarilla el rango intercuartil, las marcas inferiores y superiores de las cajas los puntos 10 y 90 %, y la línea azul el valor de calidad media.
Tras filtrar las lecturas con menor calidad se han reducido el número de secuencias
totales por muestra aproximadamente un 20 %. Además, estas lecturas restantes no superan
los 138 pares de bases de longitud, y tienen un contenido GC ligeramente inferior a las
originales (Ilustración 4B). Además, se ha conseguido mejorar notablemente la calidad de las
secuencias, las cuales poseen un valor de 40 de Phred score, que cae ligeramente hasta 38
en las últimas posiciones (Ilustración 4B).
3. Análisis de expresión diferencial
Con las lecturas procesadas de las 12 muestras se procedió a realizar el análisis de
expresión diferencial.
Del análisis estadístico llevado a cabo en R, se obtuvieron 14 y 90 genes (Ilustración
5; Tabla 3 y Tabla 4) con una expresión diferencial significativa (FDR < 0.05 y un fold change
pág. 19
de al menos ±2) para los tiempos 1 y 2 de sequía, respecto a sus correspondientes controles
(Ilustración 5). De los 14 genes con expresión diferencial significativa en T1, 8 genes
mostraron mayor nivel de expresión y 6 genes mostraron menor nivel de expresión con
respecto a los controles. De los 90 genes con expresión diferencial significativa en T2, 50
genes mostraron mayor nivel de expresión y 40 genes mostraron menor nivel de expresión
con respecto a los controles.
Ilustración 5. Número de genes con expresión diferencial en respuesta a sequía. Las barras en rojo representan los transcritos con niveles de expresión significativamente mayores a los controles, y las barras en azul representan los transcritos encontrados menores a los controles.
El hecho de que tras 20 días de sequía severa tan solo haya 14 transcritos con
expresión diferencial es otro indicio del grado de tolerancia basal que presenta Q. ilex a este
estrés. A medida que la fotosíntesis muestra una mayor inhibición (50 % en T2), la planta
necesita reajustar en mayor medida su expresión génica para sobrevivir al estrés, como se
demuestra con el gran incremento de transcriptos expresados diferencialmente a los 25
días. Este comportamiento contrasta con el encontrado en diferentes especies más
susceptibles a sequía, como en el caso de Verbena bonariensis, que muestra diferencias
muy notables en su transcriptoma tras 10 días de exposición al estrés (Wang et al., 2018).
3.1 Análisis diferencial tras los 20 días de sequía
Los resultados obtenidos se representaron empleando las gráficas más utilizadas en
transcriptómica, entre las que se incluyen las de tipo MA, Volcano y MDS (Ilustración 6,
Ilustración 7 e Ilustración 8). Las gráficas MA representan el logaritmo del fold change
0
20
40
60
T1 T2
Nú
me
ro d
e g
en
es
Tiempo
Genes con expresión diferencial significativa
pág. 20
(denominado M, que corresponde al logaritmo del ratio de los niveles de lecturas alineadas
obtenidos para cada gen entre las dos condiciones, con y sin riego) frente al logaritmo de la
media (denominado A, que corresponde a la media de los niveles de cuentas para cada gen
entre las dos condiciones). Las gráficas MA son de utilidad para visualizar la reproducibilidad
entre las muestras de un experimento. Por su parte, las gráficas Volcano son de las más
empleadas en las ciencias -ómicas, ya que permiten la rápida identificación de los resultados
más significativos entre grandes cantidades de datos (Cui & Churchill, 2003). Así, esta gráfica
enfrenta la magnitud de cambio (fold change), frente a una medida de significancia
estadística, en el presente trabajo el FDR, elegido por ser más restrictivo. Por último, las
gráficas MDS (del inglés multidimensional scaling) permiten una representación de un
patrón de proximidades entre las distintas muestras de estudio. Tanto en las gráficas MA
como en las Volcano el logaritmo del fold change está en base 2, que por convenio es el más
empleado en transcriptómica.
Ilustración 6. Representación gráfica MA de los transcritos diferencialmente expresados a los 20 días. A) representación de todos los transcritos identificados tras alinearlos con el transcriptoma de referencia. B) representación de los 14 transcritos con expresión diferencial significativa.
Ilustración 7. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 20 días. A) representación del conjunto de todos los transcritos. B) representación de los 14 transcritos significativos en cuanto a sus diferencias en los niveles de expresión.
pág. 21
Ilustración 8. Representación gráfica MDS de las muestras a los 20 días. Representación de las agrupaciones de las muestras en función de los niveles de transcriptos expresados diferencialmente. Las muestras control son representadas en color azul y las muestras sometidas a sequía se muestran en color naranja.
La Ilustración 8 muestra una clara tendencia en cuanto a la agrupación de los
conjuntos de transcritos con una expresión diferencial estadísticamente significativa en
función de si éstos provienen de muestras control o afectadas por el estrés de sequía.
Por último, para facilitar la discusión de los resultados obtenidos, los transcritos
obtenidos diferencialmente (Tabla 3) se clasificaron en distintos grupos funcionales
(Ilustración 9).
Ilustración 9. Categorización funcional de los transcritos expresados diferencialmente a los
20 días.
pág. 22
Los resultados indican que una gran parte de los transcritos, aproximadamente el
29 %, están relacionados con el metabolismo primario, entendiendo este como el que
interviene de forma directa en la supervivencia, crecimiento y reproducción de las plantas.
(Ilustración 9). A su vez, de este porcentaje, el 75 % de los transcritos son relativos al
metabolismo de los carbohidratos. El reajuste del metabolismo de los carbohidratos en
condiciones de sequía ha sido previamente descrito en otras especies (Taji et al., 2002;
Bartels & Sunkar, 2005). En el presente estudio destacan el aumento de transcritos de la
piruvato quinasa o fosfoglucomutasa y la disminución para la fosfoenolpiruvato
carboxiquinasa. Esto podría implicar un aumento de la disponibilidad de glucosa y de la
glucolisis, en conjunción con una disminución de la gluconeogénesis, causando un aumento
del nivel energético. El incremento del metabolismo primario puede ser, por tanto, una
estrategia de tolerancia a la sequía (con una fotosíntesis inhibida un 30 %) al proporcionar
energía proveniente de moléculas de reserva, tanto carbohidratos como aminoácidos, que
permita a la planta activar los mecanismos de respuesta al estrés. Además, los carbohidratos
y derivados pueden tener una función directa en estrés por sequía, ya que pueden actuar
como osmolitos que ayudan a mantener la turgencia del interior celular, participando en la
protección de membranas y proteínas, e incluso pudiendo actuar como antioxidantes (Sami
et al., 2016).
Destacan también en T1 que hasta el 14 % de los transcritos aumentados están
relacionados con proteínas de función chaperona, como las de choque térmico (o HSP por
sus siglas en inglés, Heat Shock Protein), o la proteína ClpB (por sus siglas en inglés,
Caseinolytic peptidase B protein) (Ilustración 9). Las HSP son proteínas altamente
conservadas que se incrementan su expresión ante prácticamente cualquier situación de
estrés. Varios grupos de HSP presentan función chaperona, estabilizando proteínas,
manteniendo su estructura funcional y facilitando el replegamiento de proteínas mal
plegadas a causa de las condiciones estresantes (Al-Whaibi, 2011). El mantenimiento de la
conformación nativa y funcionalmente activa de enzimas y proteínas es esencial en la
supervivencia celular durante condiciones de estrés (Wang et al., 2004). El incremento de
estos transcritos en estrés por sequía también ha sido evidenciado en Q. lobata, especie
muy cercana taxonómicamente a Q. ilex (Gugger et al., 2017).
Con otro 15 %, un tercer grupo de transcritos que varían su expresión de manera
significativa en T1 son factores de transcripción (FT) de dedos de zinc (Ilustración 9). Estos
factores de transcripción son llamados así por poseer un dominio estructural conservado
pág. 23
que cuenta con un ion de zinc coordinado, y mediante el cual son capaces de unirse al DNA.
Destaca la identificación de ZPR1, un factor de transcripción que ha sido caracterizado en
especies como el tomate, donde ha demostrado jugar un papel esencial en la respuesta a
sequía (Li et al., 2013). Esto es debido a que su promotor cuenta con elementos reguladores
en -cis que responden a ácido abscísico (ABA), la principal hormona vegetal que actúa en las
vías de señalización de respuesta a sequía; como el dominio ABRE (del inglés ABA-Responsive
Element), o el dominio de respuesta a factores de transcripción tipo MYB (del inglés
MYeloBlastosis transcription factor), también propio de este tipo de estrés (Li et al., 2013).
ZPR1 también es capaz de interaccionar con la proteína HyPRP (del inglés Hybrid Proline-Rich
Protein), un regulador negativo de la respuesta a ABA que interfiere con los sistemas
antioxidantes, esenciales durante estreses abióticos (Li et al., 2016).
Aproximadamente el 15 % de los transcritos identificados son relativos a proteínas
ribosomales (RP, del inglés Ribosomal Protein), destacando en T1 las asociadas a la
subunidad menor del ribosoma (40S), como la proteína ribosomal S21, o la S2-4 (Tabla 3). En
plantas, la mayor parte de los genes RP han mostrado una regulación diferencial de su
expresión (tanto positiva como negativamente) a causa de diversos factores ambientales,
entre los que se encuentra la sequía o la salinidad (Fromont-Racine et al., 2003). En cultivos
como el arroz, hasta el 57 % de los genes RP modulan su transcripción tras ser sometido a
sequía, de manera positiva la mayoría de ellos (Moin et al., 2017). El cambio en el patrón de
las proteínas ribosomales tras el comienzo del estrés es inmediato, y parece ser esencial
para el mantenimiento de la integridad y la estabilidad de los complejos ribosomales. Así,
éstos pueden seguir llevando a cabo la síntesis de proteínas, como de aquellas esenciales
para superar la situación de estrés (factores de transcripción, proteínas detoxificadoras o
chaperonas) (Moin et al., 2017). En base a los resultados, ya que el transcrito de la proteína
ribosomal S21 se encuentra sobreexpresado con un fold change de 7,43, y el de S2-4
disminuido con un fold change de 2,75, se propone que el recambio de una proteína por otra
en la subunidad pequeña ribosomal sea mecanismo importante en la tolerancia a sequía en
el T1 del ensayo.
Por último, los transcritos restantes, que suponen el 29 % del total, se relacionan con
proteínas de transporte de membranas, histonas y remodelación de cromatina, proteínas de
defensa y senescencia, y autofagia (Ilustración 9). En relación con último caso, el transcrito
de una proteína como es la 18b autophagy related (esencial en el control de la autofagia y el
recambio de componentes celulares) ha mostrado una represión en un estudio de estrés
pág. 24
abiótico realizado en hojas de plantas de pimiento (Capsicum annuum) (Zhai et al., 2016), de
manera similar a lo que ocurre en nuestro estudio.
3.2 Análisis diferencial tras los 25 días de sequía
Las gráficas MA, Volcano y MDS para este segundo tiempo, al igual que en T1, usadas
para la representación de los resultados obtenidos en el presente análisis del RNA-Seq, se
encuentran en las Ilustración 10, Ilustración 11 e Ilustración 12, respectivamente.
Ilustración 10. Representación gráfica MA de los transcritos diferencialmente expresados a los 25 días. A) representación de todos los transcritos identificados tras alinearlos con el transcriptoma de referencia. B) representación de los 90 transcritos con expresión diferencial significativa.
Ilustración 11. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 25 días. A) representación del conjunto de todos los transcritos. B) representación de los 90 transcritos significativos en cuanto a sus diferencias en los niveles de expresión.
pág. 25
Ilustración 12. Representación gráfica MDS de las muestras a los 25 días. Representación de las agrupaciones de las muestras en función de los niveles de transcriptos expresados diferencialmente. Las muestras control son representadas en color verde y las muestras sometidas a sequía se muestran en color rojo.
La gráfica MDS para el T2 (Ilustración 12), al igual que la correspondiente al T1,
muestra una clara tendencia al agrupar los transcritos procedentes de los controles entre
ellos, a una distancia razonable del clúster formando por las réplicas de las muestras
sometidas a sequía.
También, como en T1, se realizó una separación funcional en distintas categorías en los
que se podían agrupar los transcritos expresados diferencialmente de T2 (Tabla 4). Un
mayor número de transcritos da lugar a un mayor número de categorías para agrupar todos
los transcritos expresados diferencialmente en T2 (Ilustración 13).
Ilustración 13. Categorización funcional de los transcritos expresados diferencialmente a
los 25 días.
pág. 26
En T2, como ya se ha comentado, hay un mayor incremento de transcritos
identificados con una expresión diferencial respecto a T1 (90 transcritos frente a los 14
transcritos identificados en T1) (Ilustración 5; Tabla 4).
De los 90 transcritos identificados en T2, el 6,7 % de éstos están relacionados con los
sistemas antioxidantes de la planta, ausentes en T1 (Ilustración 9 e Ilustración 13). El
mantenimiento del balance entre producción de ROS y los sistemas de defensa, (enzimáticos
y no enzimáticos) en situaciones de estrés, es esencial , ya que estas especies pueden oxidar
múltiples componentes celulares como proteínas, lípidos, DNA y RNA, conduciendo, en
última instancia, a la muerte celular (Mittler, 2002). Transcritos encontrados
sobreexpresados dentro de este grupo, incluyen a los que codifican enzimas como catalasa,
triparredoxina o tiorredoxina (fold change de 8,3, 5,3 y 3,2), mientras que los de glutatión S-
transferasa 3 y peroxidasa se encuentran expresados a unos niveles inferiores a los controles
(fold change de -3,9 y -4, respectivamente). Dado una de las consecuencias inevitables del
estrés por sequía es un aumento en la producción de ROS (especialmente en mitocondrias y
cloroplastos), a priori cabría esperar una sobreexpresión de todos los transcritos
relacionados con la defensa del estrés oxidativo. Sin embargo, diversos estudios en distintas
especies han reflejado patrones diferentes de expresión de enzimas antioxidantes frente a
estrés por sequía que podrían estar relacionados con la edad de la planta, el nivel de
tolerancia, la estrategia para abordar la situación de estrés, así como la duración e
intensidad del mismo (Cruz de Carvalho, 2008).
Aunque el glutatión (GSH) y sus enzimas asociadas son capaces de reducir los
hidroperóxidos de lípidos de las membranas, las plantas preferentemente utilizan la
tiorredoxina como agente reductor (Cruz de Carvalho, 2008). Esto se corresponde con los
resultados obtenidos, ya que el transcrito de la tiorredoxina se encuentra aumentado y los
de enzimas relacionadas con el glutatión, como la glutatión S-transferasa, disminuidos (Tabla
4).
Por otra parte, los elevados niveles de transcrito de catalasa obtenidos, son un indicio
de que durante T2 del ensayo el estrés oxidativo era muy acusado, ya que ante un exceso
moderado H2O2 el ciclo del ascorbato/glutatión es suficiente para eliminarlo, y la catalasa no
suele mostrar sobreexpresión a nivel de transcrito (Lenne et al., 2002).
En T2 también aumenta el número de transcritos de genes que responden al ABA (6
transcritos en comparación con 1 transcrito en T1), indicio de que las respuestas a sequía
pág. 27
controladas por esta hormona se llevan a cabo en situaciones de estreses más severas.
Resulta llamativo que aparezcan en mayor medida transcritos referentes a otros tipos de
estreses como son el inducido por altas temperaturas o estrés salino, con 7 y 11 transcritos
expresados de manera diferencial, respectivamente (Ilustración 13). Esto ocurre porque los
ambientes en los que se desarrollan las plantas son complejos, y a menudos las condiciones
que dan lugar a la presencia de los distintos estreses existen simultáneamente. De hecho, las
plantas han evolucionado en consecuencia y, aunque las principales rutas moleculares de
cada estrés abiótico tengan elementos específicos de señalización, también cuentan con
partes comunes y solapantes (Cramer et al., 2011).
De esta manera, aunque el experimento se haya llevado a cabo bajo condiciones
controladas de invernadero para recrear unas condiciones de estrés por sequía, se
alcanzaron temperaturas máximas de hasta 44 oC, lo que justifica la puesta en marcha de los
sistemas de defensa frente a un estrés por altas temperaturas (destaca la inducción de
chaperonas moleculares y HSPs); e inevitablemente, la excesiva pérdida de agua en las
plantas cesadas de riego, pudo ser la causa de la aparición de un estrés salino en el interior
celular, lo que explica la aparición de transcritos en relación con dicho estrés, como por
ejemplo, el transcrito del canal de potasio AKT1 o el transcrito de la bomba de protones
vacuolar de pirofosfato, siendo sus respectivas proteínas elementos clave en el
mantenimiento de la homeostasis celular iónica y osmótica (Assaha et al., 2017). Por otro
lado, al igual que con lo deducido del estrés oxidativo, estos otros dos estreses abióticos se
observaron solamente durante T2.
A su vez, la posible presencia de estrés salino y por altas temperaturas, junto con el
de sequía podrían justificar la aparición de otro grupo de transcritos (8 en total), la mayoría
de ellos (75 %) regulados negativamente, relacionados con estrés biótico (Ilustración 13).
Los factores abióticos alteran significativamente las rutas de señalización frente a agentes
patógenos, lo que puede conllevar a la desactivación de las respuestas de defensa y, por lo
tanto, a un mayor estado de susceptibilidad en las plantas en presencia de otros estreses de
naturaleza tanto abiótica, como biótica (Suzuki et al., 2014). Por ejemplo, la represión de los
transcritos de los genes NBS-LRR (del inglés Nucleotide-Binding Site Leucine-Rich Repeat) y
de resistencia a TMV (del inglés Tobacco Mosaic Virus), en nuestro caso con valores fold
change de -3,24 y -5,38, respectivamente, ha sido reportada en estudios en presencia de
altas temperaturas en A. thaliana (Zhu et al., 2010), evidencia adicional de que este tipo de
estrés abiótico también podría estar afectando a Q. ilex en nuestro ensayo. Por otra parte,
pág. 28
la sobreexpresión de transcritos en relación con estreses bióticos (25 % restantes), puede ser
consecuencia de un incremento en los niveles de ABA inducido por el estrés por sequía, ya
que esta hormona ha mostrado inducir las cascadas de señalización relacionadas con
estreses bióticos por medio de factores de transcripción tipo MYC (del inglés
MYeloCytomatosis transcription factors), comunes a ambos estreses (Nguyen et al., 2016).
También, al igual que en T1, en T2 aparecen transcritos expresados diferencialmente
relacionados con proteínas ribosomales, procesamiento de los RNA ribosomales y
ensamblaje de los ribosomas (2 transcritos en T1 frente a 10 en T2) (Ilustración 13). Este
grupo de transcritos se encuentran regulados tanto positiva como negativamente, lo que
parece ser un patrón específico e indicativo de la importancia de la estabilización de los
ribosomas y del correcto mantenimiento de su función durante un estrés por sequía severa.
Uno de los grupos más numeroso de transcritos variables en T2, con un 22,2 %, se
relaciona con las principales rutas metabólicas celulares (Ilustración 13). Destacan cambios
en los transcritos relacionados con el metabolismo de los carbohidratos, el ciclo de Krebs, la
cadena de transporte de electrones mitocondrial, la asimilación del nitrógeno, el
metabolismo de los aminoácidos y el metabolismo de los ácidos grasos. Respecto al
metabolismo de los carbohidratos encontramos sobreexpresados transcritos relacionados
con la síntesis de almidón (almidón sintasa y UDP-glucosiltransferasa) y de trehalosa (3-
hidroxi-isobutiril-CoA hidrolasa 1), aunque también se encuentran sobreexpresados
transcritos relativos a enzimas catabólicas como amilasas y galactosidasas. Por otro lado,
encontramos transcritos aumentados y disminuidos relativos al de Krebs (isocitrato
deshidrogenasa y succinato deshidrogenasa, respectivamente), mientras que todos los
relacionados con la cadena de transporte de electrones y síntesis de ATP se encuentran
disminuidos. Teniendo en cuenta la caída fotosintética del 50 % en T2, estos reajustes
metabólicos (contradictorios en parte) podrían explicar un compromiso entre la acumulación
de azúcares como una posible fuente de energía de cara a una recuperación del estrés, y un
incremento del metabolismo celular como una estrategia para proveer a la célula energía
inmediata, necesaria para la activación de los sistemas de defensa (Wang et al., 2016). Por
otro lado, en la mayoría de las plantas sensibles a sequía, se han encontrado una
disminución en su función asimiladores de nitrógeno, como el posterior metabolismo de
aminoácidos y derivados en estreses severos, lo que se cree la principal causa de la
disminución del rendimiento de los cultivos bajo este tipo de estrés (Wang et al., 2016).
Enzimas como la aspartato aminotransferasa (AST), crucial en el metabolismo aminoacídico
pág. 29
tras el ciclo GS/GOGAT, disminuye sus niveles en estudios con varias especies sensibles a
sequía como Triticum aestivum o Leymus chinensis (Xu & Huang, 2010); sin embargo, en este
estudio se han encontrado sobreexpresados los transcritos de esta enzima (fold change de
2,45) posible marcador del nivel de tolerancia de Q. ilex. La cisteína sintasa también presenta
elevados niveles de transcrito respecto a los controles (fold change de 5,19). Esto podría
atribuirse al papel central que este aminoácido ha demostrado tener en las respuestas a los
estreses abióticos en general, ya que la cisteína es precursor de la síntesis de varias
poliaminas que actúan como osmoprotectores; además, mediante el ratio entre cisteína
libre y su dímero (CySS/2Cys), ésta actúa como un sensor del potencial redox celular,
actuando en conjunción con proteínas integrantes de los sistemas antioxidantes, como la
tiorredoxina (mencionada anteriormente y cuyo transcrito se encuentras sobreexpresado
aquí), aunque estos mecanismos en relación al estrés hídrico no están dilucidados por
completo aún (Zagorchev et al., 2013). Finalmente, las variaciones en los niveles de
transcritos relacionados con la síntesis de lípidos, como la colina quinasa, pueden
relacionarse con cambios en la composición de las membranas lipídicas, ya que se ha
reportado que un incremento en el contenido de ácidos grasos insaturados en las
membranas puede contribuir a la tolerancia a la deshidratación en hojas de la especie
Cynodon dactylon (Zhong et al., 2011). Además, la colina es precursora de la glicín-betaína,
otro osmolito protector, cuyas vías metabólicas se han encontrado sobreexpresadas en
variedades de especies tolerantes a sequía, estrés salino y altas temperaturas, como Atriplex
halimus, Spinacia oleracea o Zea mays, entre otras especies (Chen & Murata, 2011).
Por último, cabe mencionar algunos conjuntos de transcritos, que suponen hasta el
21,1 % del total, y un cuya expresión diferencial con relación al estudio no está clara
(Ilustración 13). Aquí se incluyen quinasas, GTPasas y elementos de vías de señalización
mediadas por calcio, transcritos de proteínas relacionadas con la modificación de histonas y
remodelación de cromatina, maquinaria de degradación de proteínas (proteasoma y
ubiquitina) y algunos transcritos de proteínas de distintos sistemas de transporte.
4. Comparación de T1 y T2: análisis de términos de Ontología Génica
Los términos de Ontología Génica (o GO terms, del inglés Gene Ontology terms),
nacen de un proyecto colaborativo que tiene por objetivo aunar las descripciones de los
productos de los genes, de manera que el empleo de estos términos facilitara enormemente
la búsqueda cruzada entre las distintas bases de datos. El proyecto GO ha desarrollado tres
pág. 30
vocabularios estructurados, independientes y no solapantes, (llamados ontologías) que
describen el producto de un gen en función del proceso biológico asociado, de los
componentes celulares, y de las funciones moleculares (Plessis et al., 2011). El empleo de
esta terminología es de gran utilidad en áreas de la investigación que manejan grandes
cantidades de datos, como son las tecnologías -ómicas en general y la transcriptómica, en
particular. Así, en este estudio, se han empleado los términos GO sobre el conjunto de
transcritos que han mostrado una expresión diferencial en ambos tiempos, para entender
los mecanismos subyacentes a la tolerancia a la sequía de una manera más integrada. Esto a
su vez puede ser de utilidad para establecer un perfil funcional del conjunto de transcritos
obtenidos. Las representaciones de las tres ontologías GO obtenidas para este ensayo se
muestran en las Ilustración 15, Ilustración 16 e Ilustración 17.
Entre las funciones moleculares más representativas de ambos tiempos se
encuentran categorías relacionadas con los ribosomas, como constituyentes estructurales de
los mismos o de unión a RNA (Ilustración 15). Esto se coincide con lo discutido en apartados
anteriores y reafirma la importancia del mantenimiento funcional de este orgánulo en la
tolerancia a estrés por sequía. Destacan también la aparición de actividades enzimáticas
relacionadas con el metabolismo primario (oxidorreductasas, isomerasas, hidrolasas) así
como vías de señalización (quinasas y GTPasas), especialmente en el segundo tiempo,
contrastando así con la categoría “unión a lípidos” que aparece únicamente en el primer
tiempo, pareciendo indicar que estos son más relevantes a T1 en cuanto a tolerancia se
refiere (Ilustración 15).
La ontología relativa a procesos biológicos indica que los genes cuyos transcritos
variaron más durante el experimento en ambos tiempos son los relacionados con la
respuesta a estreses (Ilustración 16). Los procesos catabólicos, biosintéticos y los
relacionados con el metabolismo de compuestos nitrogenados, precursores energéticos y
moléculas pequeñas también aparecen entre los más abundantes en el segundo tiempo,
evidencia de los complejos ajustes metabólicos que se llevan a cabo en el interior celular una
vez iniciado y avanzado el estrés hídrico. Junto con estos, la aparición de alteración en la
traducción y en la biogénesis de ribosomas reafirma una vez más lo discutido anteriormente.
Además, el hecho de que categorías como las relacionadas con cambios en el crecimiento,
división celular, y con el desarrollo anatómico y estructural, aparezcan entre las más
relevantes en el segundo tiempo, explican el negativo impacto que tienen los estreses en el
desarrollo normal de una planta (todo ello a causa de desajustes en las rutas de las
pág. 31
principales fitohormonas) (Pandey et al., 2017), y lo que justificaría, a su vez, la inminente
necesidad del desarrollo de especies más tolerantes en un futuro cercano.
Por último, los términos GO relacionados con los distintos componentes celulares
(Ilustración 17), indican que los procesos más relevantes durante la respuesta al estrés
hídrico ocurren de manera predominante en el interior celular (frente al apoplasto),
especialmente en orgánulos como el cloroplasto (cambios metabólicos y energéticos), el
núcleo (regulación de la expresión génica), o los ribosomas (correcta síntesis de proteínas).
5. Integración de resultados: transcriptómica y proteómica
En la medida en que cada -ómica ofrece una visión parcial y sesgada del
funcionamiento de un sistema biológico, la integración de los datos provenientes de las
distintas -ómicas supone una poderosa herramienta para reconstruir y analizar las complejas
interacciones multidimensionales que ocurren en el interior celular en un tiempo
determinado bajo unas condiciones específicas. Mientras que la transcriptómica tiene como
ventaja su mayor potencial analítico, por la gran salida de datos que se generan, la
proteómica resulta de interés al encontrarse funcionalmente más cercana al fenotipo.
Además, son numerosos estudios de integración transcriptoma-proteoma los que muestran
una falta de correlación entre los mRNA y las correspondientes proteínas en determinadas
circunstancias experimentales, lo cual se explica por la existencia de mecanismos de control
de la expresión génica a nivel post-transcripcional, traduccional y/o post-traduccional (Peng
et al., 2015).
En este TFG se integran los datos transcriptómicos y proteómicos (Papa, 2018), con el
objetivo de una mejor compresión de los mecanismos de respuesta subyacentes a la
tolerancia en Q. ilex ante un estrés por sequía severa. Con tal fin, el material vegetal de
partida se dividió para, además de realizar el estudio transcriptómico por RNA-Seq, llevar a
cabo un ensayo proteómico doble, basado en gel (electroforesis monodimensional) y
mediante tecnología shotgun (Papa, 2018).
El estudio proteómico llevado a cabo previamente en Q. ilex en el primer tiempo
reveló cambios significativos en 344 proteínas pertenecientes a varios grupos funcionales,
185 de las cuales mostraban un aumento respecto a los controles, y 186 niveles inferiores
(± 2 fold change). De todos ellos, los relativos al metabolismo de los carbohidratos muestran
un aumento en la mayoría de las proteínas significativas identificadas (Ilustración 14 A). Esta
tendencia corresponde con los datos transcriptómicos discutidos anteriormente, en los que
pág. 32
hasta el 75 % de los transcritos relacionados con el metabolismo de los carbohidratos
aumentaban de manera significativa para el primer tiempo (Ilustración 9). También
aparecen sobrerrepresentadas en el primer tiempo proteínas relacionadas con estreses
abióticos y bióticos, señalización redox y respuesta a estrés oxidativo, fotosíntesis y
organización celular (datos no mostrados), cuyos transcritos no han sido identificados en los
datos ya discutidos.
Ilustración 14. Grupos funcionales identificados en el estudio proteómico. A) Q. ilex, tiempo 1. B) Q. ilex, tiempo 2. En rojo las proteínas aumentadas, en azul las disminuidas. Las categorías son: 3. Metabolismo principal de carbohidratos; 4. Metabolismo menor de carbohidratos; 13. Metabolismo aminoácidos; 20. Estreses bióticos y abióticos; 21. Señalización redox y estrés oxidativo; 29. Síntesis/degradación de proteínas.
En el tiempo 2 se encontraron cambios significativos en los niveles de 331 proteínas, de
las cuales 195 se encontraban con los niveles incrementados en sequía, y 136 con los niveles
disminuidos respecto a los controles. Estas se encuadran dentro unos grupos funcionales
solapantes en mayor medida con los datos transcriptómicos del segundo tiempo (Ilustración
14), con algunas discrepancias. El aumento en los niveles de transcritos de proteínas
relacionadas con los estreses oxidativo, abióticos y bióticos, se corresponde con un
incremento significativo en las proteínas de estas categorías (Ilustración 13 e Ilustración
14B). La mayor parte de las proteínas estudiadas en relación con el metabolismo de los
aminoácidos se encuentran disminuidas, aunque se identifican varias proteínas relacionadas
con la síntesis de aminoácidos que se encuentran sobrerrepresentadas en las hojas en
sequía. Este hecho, en conjunción con los datos transcriptómicos, que muestran un
metabolismo aminoacídico inducido, parece indicar la necesidad de una mayor disposición
de aminoácidos libres. Una hipótesis que explica estos resultados es que dichos aminoácidos
son empleados en la síntesis de nuevas proteínas relacionadas con la tolerancia a sequía, ya
que la síntesis proteica total está inducida en el T2 frente a los controles (Papa, 2018). Esta
pág. 33
hipótesis se refuerza teniendo en cuenta la identificación de un gran número de transcritos
relacionados con la estabilización y el mantenimiento funcional de los ribosomas, tanto en
T1 como en T2. Por otro lado, en relación con el metabolismo de los carbohidratos, muy
sobreexpresado a nivel de transcrito en T2, no encuentra tal correspondencia a nivel de
proteína. El resultado de la integración transcriptómica-proteómica se resume en la Tabla 5:
Tabla 5. Comparación de los datos generados por las aproximaciones de transcriptómica y proteómica. En rojo aparecen indicados las categorías funcionales cuya mayor parte de transcritos o proteínas presentan resultados significativos con cambios de fold change superiores a 2 respecto a los controles; en azul, inferiores a 2.
De la Tabla 5 se puede concluir que existe una elevada correspondencia funcional transcrito-proteína en condiciones de sequía severa en Q. ilex.
pág. 34
Conclusiones
• El tratamiento de sequía severo durante 25 días no ocasionó muerte de las plantas, ni
daños visibles tales como marchitez, caída de hojas o clorosis. El contenido hídrico relativo
de las hojas y raíces fue similar entre las plantas control y las sometidas a sequía. Los valores
de fluorescencia de las hojas de las plantas control y de las sometidas a sequía mostraron un
descenso del 30 % a los 20 días, y un 50 % a los 25 días tras el cese del riego. Se confirmó el
carácter altamente tolerante de la encina a sequía.
• El procesamiento de las lecturas con FastX Toolkit permitió obtener secuencias de alta
calidad aptas para alinearlas con el transcriptoma de referencia de Q. ilex.
• El análisis transcriptómico reveló cambios cualitativos y cuantitativos en la expresión de
14 y 90 genes a los 20 y 25 días, respectivamente. A los 20 días, se observó un aumento y
una disminución de, respectivamente, 8 y 6 genes. A los 25 días, el número de genes
sobreexpresados fue de 50 y 40 los que disminuyeron.
• Los genes con expresión diferencial a los 20 días correspondieron a los siguientes grupos
funcionales: metabolismo de carbohidratos y aminoácidos, factores de transcripción dedos
de zinc, proteínas ribosomales y chaperonas moleculares. A los 25 días aparecieron
sobreexpresados, además, genes de respuesta a estrés y homeostasis redox.
• Para los grupos funcionales relacionados con el metabolismo de carbohidratos,
metabolismo de aminoácidos, metabolismo de poliaminas y nucleótidos, procesamiento de
RNA, estreses abióticos y bióticos, homeostasis redox, síntesis y degradación de proteínas y
transporte, existe una buena correlación entre los datos obtenidos con cada las
aproximaciones de transcriptómica y proteómica.
pág. 35
Conclusions
• No drought symptoms such as wilting, leaf fall or chlorosis, were observed in the plants.
The relative water content in the leaves and roots was quite similar between control plants
and those subjected to drought. The fluorescence values between both treatments
decreased a 30 % and 50 % at 20 and 25 days, respectively. Thus, Q. ilex is a drought-tolerant
species.
• The processing of the readings using FastX Toolkit allowed obtaining high quality
sequences for aligning them with the de novo transcriptome of Q. ilex.
• The transcriptomic analysis showed both qualitative and quantitative changes in the
expression of 14 and 90 genes at 20 and 25 days, respectively. An increase and a decrease of
expression in 8 and 6 genes, respectively, was observed at 20 days. On the other hand, the
number of overexpressed and underexpressed genes was 50 and 40, respectively, at 25
days.
• The genes with differential expression at 20 days were grouped in several functional
groups such as carbohydrate and amino acid metabolism, transcription factors (zinc-fingers),
ribosomal proteins and chaperons. At 25 days, genes related to stress and redox
homeostasis were also overexpressed.
• A good correlation between the transcriptomic and proteomic data was observed in the
functional groups related to the carbohydrate metabolism, amino acid metabolism,
polyamine metabolism, biotic and abiotic stresses, redox homeostasis, synthesis and
degradation of proteins, and transport.
pág. 36
Bibliografía
Al-Whaibi MH. 2011. Plant heat-shock proteins: A mini review. Journal of King Saud
University. Science 23, 139–150.
Aranda I, Ramírez-Valiente JA, Rodríguez-Calcerrada JR. 2014. Características funcionales
que influyen en la respuesta a la sequía de las especies del género Quercus: variación inter- e
intra-específica. Tree physiology 25, 1–14.
Assaha DVM, Ueda A, Saneoka H, Al-Yahyai R, Yaish MW. 2017. The Role of Na+ and K+
Transporters in Salt Stress Adaptation in Glycophytes. Frontiers in Physiology 8, 509–528.
Bartels D, Sunkar R. 2005. Drought and salt tolerance in plants. Critical Reviews in Plant
Sciences 24, 23–58.
Bonner F, Vozzo J. 1987. Seed Biology and Technology of Quercus. General Technical Report,
SO-66. New Orleans, LA: U.S. Dept. of Agriculture, Forest Service, Southern Forest
Experiment Station. 21 p.
Braitenberg V, Schüz A. 1998. Ecology of Mediterranean Evergreen Oak Forests. Berlin,
Heidelberg: Springer Berlin Heidelberg.
Caliskan S. 2014. Germination and seedling growth of holm oak (Quercus ilex L.): effects of
provenance, temperature, and radicle pruning. iForest - Biogeosciences and Forestry 7, 103–
109.
Cañellas I, Roig S, Poblaciones MJ, Gea-Izquierdo G, Olea L. 2007. An approach to acorn
production in Iberian dehesas. Agroforestry Systems 70, 3–9.
Chen THH, Murata N. 2011. Glycinebetaine protects plants against abiotic stress:
Mechanisms and biotechnological applications. Plant, Cell and Environment 34, 1–20.
Corbineau F, Xia Q, Bailly C, El-Maarouf-Bouteau H. 2014. Ethylene, a key factor in the
regulation of seed dormancy. Frontiers in Plant Science 5, 1–13.
Cramer GR, Urano K, Delrot S, Pezzotti M, Shinozaki K. 2011. Effects of abiotic stress on
plants: A systems biology perspective. BMC Plant Biology 11, 163–177.
Cruz de Carvalho MH. 2008. Drought stress and reactive oxygen species. 3, 156–165.
Cui X, Churchill GA. 2003. Statistical tests for differential expression in cDNA microarray
experiments. Genome Biology 4, 210–220.
Echevarría-Zomeño S, Abril N, Ruiz-Laguna J, Jorrín-Novo J, Maldonado-Alconada AM.
2012. Simple, rapid and reliable methods to obtain high quality RNA and genomic DNA from
Quercus ilex L. leaves suitable for molecular biology studies. Acta Physiologiae Plantarum 34,
pág. 37
793–805.
Echevarría-Zomeño S, Ariza D, Jorge I, Lenz C, Del Campo A, Jorrín-Novo JV., Navarro RM.
2009. Changes in the protein profile of Quercus ilex leaves in response to drought stress and
recovery. Journal of Plant Physiology 166, 233–245.
Fromont-Racine M, Senger B, Saveanu C, Fasiolo F. 2003. Ribosome assembly in eukaryotes.
Gene 313, 17–42.
Gómez-Gálvez I. 2017. Análisis proteómico de la respuesta a sequía en encina (Quercus ilex
L.). Trabajo Final de Grado.
González C. 2008. Analysis of the Oak Decline in Spain; ‘la seca’. Tesis de licenciatura.
Guerrero-Sánchez VM, Maldonado-Alconada AM, Amil-Ruiz F, Jorrín-Novo JV. 2017. Holm
oak (Quercus ilex) Transcriptome. De novo Sequencing and Assembly Analysis. Frontiers in
Molecular Biosciences 4, 1–5.
Gugger PF, Peñaloza-Ramírez JM, Wright JW, Sork VL. 2017. Whole-transcriptome response
to water stress in a California endemic oak, Quercus lobata. Tree Physiology 37, 632–644.
Hansen KD, Brenner SE, Dudoit S. 2010. Biases in Illumina transcriptome sequencing caused
by random hexamer priming. Nucleic acids research 38, 1–7.
Hoagland DR, Arnon DI. 1950. The water-culture method for growing plants without soil.
California Agricultural Experiment Station Circular 347, 1–32.
Hou Z, Jiang P, Swanson SA, Elwell AL, Nguyen BKS, Bolin JM, Stewart R, Thomson JA. 2015.
A cost-effective RNA sequencing protocol for large-scale gene expression studies. Scientific
Reports 5, 1–5.
Jorrín-Novo JV., Maldonado AM, Echevarría-Zomeño S, Valledor L, Castillejo MA, Curto M,
Valero J, Sghaier B, Donoso G, Redondo I. 2009. Plant proteomics update (2007-2008):
Second-generation proteomic techniques, an appropriate experimental design, and data
analysis to fulfill MIAPE standards, increase plant proteome coverage and expand biological
knowledge. Journal of Proteomics 72, 285–314.
Lenne C, Leblanc N, Julien J, Roeckel-drevet P. 2002. Two GPX-like proteins from
Lycopersicon esculentum and Helianthus annuus are antioxidant enzymes with phospholipid
hydroperoxide glutathione peroxidase and thioredoxin peroxidase activities. European
Journal of Biochemistry 269, 2414–2420.
Li J, Ouyang B, Wang T, Luo Z, Yang C, Li H, Sima W, Zhang J, Ye Z. 2016. HyPRP1 gene
suppressed by multiple stresses plays a negative role in abiotic stress tolerance in tomato.
Frontiers in Plant Science 7, 1–14.
pág. 38
Li J, Sima W, Ouyang B, Luo Z, Yang C, Ye Z, Li H. 2013. Identification and expression pattern
of a ZPR1 gene in wild tomato (Solanum Pennellii). Plant Molecular Biology Reporter 31,
409–417.
Lindner M, Maroschek M, Netherer S, Kremer A, Barbati A, Garcia-Gonzalo J, Seidl R,
Delzon S, Corona P, Kolström M, Lexer MJ, Marchetti M. 2010. Climate change impacts,
adaptive capacity, and vulnerability of European forest ecosystems. Forest Ecology and
Management 259, 698–709.
López-Hidalgo C, Guerrero-Sánchez VM, Gómez-Gálvez I, Sánchez-Lucas R, Castillejo-
Sánchez MA, Maldonado-Alconada AM, Valledor L, Jorrín-Novo JV. 2018. A multi-Omics
analysis pipeline for the metabolic pathway reconstruction in the orphan species Quercus
ilex. Frontiers in Plant Science 9, 1–16.
Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T. 2017. Transcriptomics technologies. PLoS
Computational Biology 13, 1–23.
Manes F, Vitale M, Donato E, Giannini M, Puppi G. 2006. Different ability of three
Mediterranean oak species to tolerate progressive water stress. Photosynthetica 44, 387–
393.
Mittler R. 2002. Oxidative stress, antioxidants and and stress tolerance. Trends in plants science 7, 405-410.
Moin M, Bakshi A, Madhav MS, Kirti PB. 2017. Expression profiling of ribosomal protein
gene family in dehydration stress responses and characterization of transgenic rice plants
overexpressing RPL23A for water-use efficiency and tolerance to drought and salt stresses.
Frontiers in Chemistry 5, 1–16.
Moro R. 2002. Guía De Los Árboles De España (OMEGA, Ed.). Barcelona.
Nguyen D, Rieu I, Mariani C, van Dam NM. 2016. How plants handle multiple stresses:
hormonal interactions underlying responses to abiotic stress and insect herbivory. Plant
Molecular Biology 91, 727–740.
Pandey P, Irulappan V, Bagavathiannan MV, Sanchez LE. 2017. Impact of combined abiotic
and biotic stresses on plant growth and avenues for crop improvement by exploiting physio-
morphological Traits. 8, 1–15.
Papa Vettorazzi ME. 2018. Estudio de la variabilidad de respuesta a sequía en poblaciones
andaluzas de encina (Quercus ilex L.) mediante aproximaciones proteómicas. Trabajo Final
de Máster.
Pasta S, Rigo D De, Caudullo G. 2016. Quercus ilex in Europe : distribution, habitat, usage
pág. 39
and threats. European Atlas of Forest Tree Species; European Union: Luxembourg 156–157.
Peguero-pina JJ, Mendoza-herrer Ó, Gil-pelegr E, Sancho-knapik D. 2018. Cavitation limits
the recovery of gas exchange after severe drought stress in Holm oak (Quercus ilex L.).
Forests 9, 443–456.
Peng X, Qin Z, Zhang G, Guo Y, Huang J. 2015. Integration of the proteome and
transcriptome reveals multiple levels of gene regulation in the rice dl2 mutant. Frontiers in
Plant Science 6, 351–362.
Plessis L, Nives S, Dessimoz C. 2011. The what, where, how and why of gene ontology - a
primer for bioinformaticians. 12, 723–735.
Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK. 2015. Limma powers
differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids
Research 43, e47.
Rohácêk K. 2002. Chlorophyll fluorescence parameters: the definitions, photosynthetic
meaning, and mutual relationships.
Romero-Rodríguez MC, Pascual J, Valledor L, Jorrín-Novo J. 2014. Improving the quality of
protein identification in non-model species. Characterization of Quercus ilex seed and Pinus
radiata needle proteomes by using SEQUEST and custom databases. Journal of Proteomics
105, 85–91.
Sami F, Yusuf M, Faizan M, Faraz A, Hayat S. 2016. Role of sugars under abiotic stress. Plant
Physiology and Biochemistry 109, 54–61.
Sghaier-Hammami B, Redondo-López I, Valero-Galván J, Jorrín-Novo JV. 2016. Protein
profile of cotyledon, tegument, and embryonic axis of mature acorns from a non-orthodox
plant species: Quercus ilex. Planta 243, 369–396.
Sghaier-Hammami B, Valero-Galván J, Romero-Rodríguez MC, Navarro-Cerrillo RM, Abdelly
C, Jorrín-Novo JV. 2013. Physiological and proteomics analyses of Holm oak (Quercus ilex
subsp. ballota [Desf.] Samp.) responses to Phytophthora cinnamomi. Plant Physiology and
Biochemistry 71, 191–202.
Suzuki N, Rivero RM, Shulaev V, Blumwald E, Mittler R. 2014. Abiotic and biotic stress
combinations. New Phytologist 203, 32–43.
Taji T, Ohsumi C, Iuchi S, Seki M, Kasuga M, Kobayashi M, Yamaguchi-Shinozaki K,
Shinozaki K. 2002. Important roles of drought- and cold-inducible genes for galactinol
synthase in stress tolerance in Arabidopsis thaliana. Plant Journal 29, 417–426.
Valero-Galván J, Jorrín-Novo JV, Cabrera AG, Ariza D, García-Olmo J, Cerrillo RMN. 2012.
pág. 40
Population variability based on the morphometry and chemical composition of the acorn in
Holm oak (Quercus ilex subsp. ballota [Desf.] Samp.). European Journal of Forest Research
131, 893–904.
Valero-Galván J, Valledor L, Cerrillo RMN, Gil-Pelegrin E, Jorrín-Novo J V. 2011. Studies of
variability in Holm oak (Quercus ilex subsp. ballota [Desf.] Samp.) through acorn protein
profile analysis. Journal of Proteomics 74, 1244–1255.
Velculescu VE, Zhang L, Zhou W, Vogelstein J, Basrai MA, Bassett DE, Hieter P, Vogelstein
B, Kinzler KW. 1997. Characterization of the yeast transcriptome. Cell 88, 243–251.
Wang X, Cai X, Xu C, Wang Q, Dai S. 2016. Drought-responsive mechanisms in plant leaves
revealed by proteomics. International Journal of Molecular Sciences 17, 1706–1736.
Wang Z, Gerstein M, Snyder M. 2001. RNA-Seq: a revolutionary tool for transcriptomics
Zhong. Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins 10, 57–63.
Wang B, Lv XQ, He L, Zhao Q, Xu MS, Zhang L, Jia Y, Zhang F, Liu FL, Liu QL. 2018. Whole-
transcriptome sequence analysis of Verbena bonariensis in response to drought stress.
International Journal of Molecular Sciences 19, 1751–1771.
Wang W, Vinocur B, Shoseyov O, Altman A. 2004. Role of plant heat-shock proteins and
molecular chaperones in the abiotic stress response. Trends in Plant Science 9, 244–252.
Xu C, Huang B. 2010. Comparative analysis of drought responsive proteins in Kentucky
bluegrass cultivars contrasting in drought tolerance. Crop Science 50, 2543–2552.
Zagorchev L, Seal CE, Kranner I, Odjakova M. 2013. A central role for thiols in plant
tolerance to abiotic stress. International Journal of Molecular Sciences 14, 7405–7432.
Zhai Y, Guo M, Wang H, Lu J, Liu J, Zhang C, Gong Z, Lu M. 2016. Autophagy, a conserved
mechanism for protein degradation, responds to heat, and other abiotic stresses in
Capsicum annuum L. Frontiers in Plant Science 7, 1–13.
Zhong D, Du H, Wang Z, Huang B. 2011. Genotypic variation in fatty acid composition and
unsaturation levels in bermudagrass associated with leaf dehydration tolerance. Journal of
the American Society for Horticultural Science 136, 35–40.
Zhu Y, Qian W, Hua J. 2010. Temperature Modulates Plant Defense Responses through NB-
LRR Proteins. PLoS Pathogens 6, e1000844.
pág. 41
Anexo Tabla 2. Valores de RIN de las preparaciones de RNA. El código de las muestras indica el origen (S, Sevilla), el tiempo de ensayo (1 o F, si es T1 o T2); el tratamiento (C, control o S, sequía), y el número de réplica 1-5).
Nº muestra Código RIN
1 S1-C3 8.40
2 S1-C4 8.20
3 S1-C5 8.30
4 SF-C1 8.40
5 SF-C3 8.20
6 SF-C4 -
7 S1-S2 8.30
8 S1-S3 8.50
9 S1-S5 8.10
10 SF-S1 8.80
11 SF-S2 8.20
12 SF-S5 8.30
pág. 42
Tabla 3. Genes con expresión diferencial a los 20 días del ensayo. Los valores de fold change de los genes sobreexpresados o disminuidos en condiciones de sequía frente a los controles aparecen en rojo y en azul, respectivamente.
Nº #ID Gen Fold Change FDR Descripción
1 qilexmiraassembly_c15040 RPS21 7,434 1,39E-07 40S ribosomal protein S21 2 qilexmiraassembly_c23734 HSP70 4,004 0,011 Heat shock cognate 70 kDa protein 3 qilexmiraassembly_c317688 KPYG_RICCO 3,284 0,020 Pyruvate kinase 4 qilexmiraassembly_c86195 clpB 3,188 0,020 Chaperone protein ClpB 5 qilexmiraassembly_c76542 L484_018464 2,571 0,020 Zinc finger protein 6 qilexmiraassembly_c6669 zpr1 2,536 0,020 Zinc finger protein ZPR1 7 qilexmiraassembly_c142882 OEP16 2,167 0,045 Plastid 16-kDa outer membrane protein 8 qilexmiraassembly_c204436 pgm 2,167 0,045 Phosphoglucomutase 9 qilexmiraassembly_c128557 JD1 -2,524 0,020 1-acylglycerophosphocholine O-acyltransferase 1
10 qilexmiraassembly_c65939 ATG18B -2,676 0,020 Autophagy-related protein 18b 11 qilexmiraassembly_dn_c41725 RPS2D -2,750 0,034 40S ribosomal protein S2-4 12 qilexmiraassembly_c184180 pck -3,142 0,020 Phosphoenolpyruvate carboxykinase 13 qilexmiraassembly_c380446 BnaCnng75900D -3,867 0,020 BnaCnng75900D protein 14 qilexmiraassembly_c36413 ABE2 -5,629 0,045 Histone H2B
pág. 43
Tabla 4. Genes con expresión diferencial a los 25 días del ensayo. Los valores de fold change de los genes sobreexpresados o disminuidos en condiciones de sequía frente a los controles aparecen en rojo y en azul, respectivamente.
Nº #ID Gen Fold change FDR Descripción
1 qilexmiraassembly_c81150 cat 8,343 0,019 Catalase 2 qilexmiraassembly_dn_c30296 rpsA 6,778 1,122E-05 30S ribosomal protein S1 3 qilexmiraassembly_c72161 PAB1 6,638 2,030E-05 Proteasome subunit alpha type-2-A 4 qilexmiraassembly_c17666 XW6 5,646 0,029 Pco131882 5 qilexmiraassembly_c102169 PIMT1 5,428 0,029 Protein-L-isoaspartate O-methyltransferase 1 6 qilexmiraassembly_c235002 TXN1 5,345 0,008 Tryparedoxin 7 qilexmiraassembly_c15739 MTK 5,232 0,028 Methylthioribose kinase
8 qilexmiraassembly_dn_c38735 CYSC1 5,191 0,019 Bifunctional L-3-cyanoalanine synthase/cysteine synthase C1, mitochondrial
9 qilexmiraassembly_c49796 pcmt 4,947 0,041 L-isoaspartyl protein carboxyl methyltransferase 10 qilexmiraassembly_c44819 nifU 4,705 0,000 Iron-sulfur cluster assembly factor 11 qilexmiraassembly_c68581 pAbp 4,646 0,019 PABP 12 qilexmiraassembly_c150586 SAS10 4,594 0,043 SAS10 13 qilexmiraassembly_c89041 ko 4,574 0,017 Ent-kaurene oxidase 14 qilexmiraassembly_c27045 pdha1 4,284 0,041 Pyruvate dehydrogenase E1 component subunit alpha 15 qilexmiraassembly_c114737 VAMP727 4,135 0,044 Vesicle-associated membrane protein 727 16 qilexmiraassembly_c143481 htrA 3,862 0,044 Strongly similar to serine protease 17 qilexmiraassembly_c139611 GWD 3,742 0,014 Alpha-glucan water dikinase, chloroplastic
18 qilexmiraassembly_c89767 At5g16180 3,705 0,016 Chloroplastic group IIA intron splicing facilitator CRS1, Chloroplastic
19 qilexmiraassembly_c74412 CBSCLC6 3,696 0,022 Putative chloride channel-like protein CLC-g 20 qilexmiraassembly_c22102 TOC34 3,683 0,044 Translocase of chloroplast 34
21 qilexmiraassembly_c42894 JAC1 3,572 0,040 J domain-containing protein required for chloroplast accumulation response 1
22 qilexmiraassembly_c173111 SGD 3,553 0,044 Strictosidine beta-D-glucosidase
23 qilexmiraassembly_c118937 ppa 3,517 0,019 Pyrophosphate-energized vacuolar membrane proton pump
pág. 44
24 qilexmiraassembly_c111836 r7 3,498 0,029 Putative non-TIR-NBS-containing resistance protein 25 qilexmiraassembly_c71757 fca 3,491 0,044 Putative FCA orthologue 26 qilexmiraassembly_c193798 IDH (NADP+) 3,441 0,020 Putative isocitrate dehydrogenase
27 qilexmiraassembly_c404976 PGSC0003DMG4
00017062 3,380 0,035 NB-ARC domain disease resistance protein
28 qilexmiraassembly_dn_c212 SS3 3,380 0,030 Soluble starch synthase 3, chloroplastic/amyloplastic
29 qilexmiraassembly_c160617 UGT76A2 3,341 0,028 UDP-glucose iridoid glucosyltransferase
30 qilexmiraassembly_c26585 trxh 3,275 0,037 Thioredoxin
31 qilexmiraassembly_c113753 ipk1A 3,263 0,004 Inositol-pentakisphosphate 2-kinase
32 qilexmiraassembly_c28583 pap1 3,129 0,023 Purple acid phosphatase
33 qilexmiraassembly_c19071 CML21 3,066 0,022 Putative calcium-binding protein CML21
34 qilexmiraassembly_c39036 At5g40530 2,998 0,031 Ribosomal RNA-processing protein 8
35 qilexmiraassembly_c189605 fcl2 2,971 0,025 Methenyltetrahydrofolate synthase domain-containing protein
36 qilexmiraassembly_c40813 RPS26B 2,939 0,023 40S ribosomal protein S26-2
37 qilexmiraassembly_c123067 Os06g0184766 2,872 0,019 Os06g0184766 protein
38 qilexmiraassembly_c93193 At4g30990 2,745 0,044 Down-regulated in metastasis (DRIM) domain-containing protein
39 qilexmiraassembly_c45002 KCA1 2,628 0,044 Kinesin-like protein KCA1
40 qilexmiraassembly_c188928 PIM1 2,607 0,019 Cell differentiation, Rcd1-like protein
41 qilexmiraassembly_c6358 AGAL1 2,589 0,019 Alpha-galactosidase 1
42 qilexmiraassembly_c171676 dhx35 2,551 0,044 Putative ATP-dependent RNA helicase DHX35
43 qilexmiraassembly_c108827 GSO1 2,550 0,044 LRR receptor-like serine/threonine-protein kinase GSO1
44 qilexmiraassembly_c114584 AAT1 2,448 0,044 Aspartate aminotransferase
45 qilexmiraassembly_c86195 clpB 2,434 0,043 Chaperone protein ClpB
46 qilexmiraassembly_dn_c8891 RPS5 2,371 0,044 40S ribosomal protein S5
47 qilexmiraassembly_c147090 glysoja_014070 2,317 0,044 3-hydroxyisobutyryl-CoA hydrolase 1
48 qilexmiraassembly_c203407 CRK1 2,284 0,016 CDPK-related protein kinase
49 qilexmiraassembly_c57793 SNAP33 2,198 0,044 SNAP25 homologous protein SNAP33
50 qilexmiraassembly_c89253 CYP40 2,156 0,045 Peptidyl-prolyl cis-trans isomerase CYP40
51 qilexmiraassembly_dn_c441 RPL35 -2,120 0,044 60S ribosomal protein L35
pág. 45
52 qilexmiraassembly_c6869 At2g22425 -2,314 0,033 Probable signal peptidase complex subunit 1
53 qilexmiraassembly_c9738 SFH8 -2,412 0,018 Phosphatidylinositol/phosphatidylcholine transfer protein SFH8
54 qilexmiraassembly_c87075 myb -2,656 0,046 MYB transcription factor R2R3 type
55 qilexmiraassembly_dn_c13879 adc1 -2,720 0,044 Arginine decarboxylase
56 qilexmiraassembly_c307432 AOF2 -3,044 0,019 Lysine-specific histone demethylase-like protein
57 qilexmiraassembly_dn_c41725 RPS2D -3,048 0,014 40S ribosomal protein S2-4
58 qilexmiraassembly_c102959 CXE1 -3,108 0,042 Carboxylesterase 1
59 qilexmiraassembly_c123906 ndhF -3,126 0,045 NADH-plastoquinone oxidoreductase subunit 5
60 qilexmiraassembly_c244652 akt2 -3,158 0,045 Potassium channel AKT1
61 qilexmiraassembly_c15174 CML19 -3,215 0,041 EF hand calcium-binding family protein
62 qilexmiraassembly_c168011 NLR3 -3,238 0,044 NBS-LRR-like protein
63 qilexmiraassembly_c403110 hsp70B -3,467 0,004 Heat shock protein 70B
64 qilexmiraassembly_c128665 acT2 -3,616 0,038 Putative PF02458-family acyl transferase 2
65 qilexmiraassembly_c225630 IRK1 -3,637 0,046 Serine/threonine-protein kinase
66 qilexmiraassembly_c34380 dhsb -3,656 0,028 Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial
67 qilexmiraassembly_c10376 A34 -3,750 0,022 Histone H2A
68 qilexmiraassembly_c16884 DGP6 -3,793 0,029 Large subunit GTPase 1
69 qilexmiraassembly_dn_c1439 ATH1 -3,820 0,044 Cytochrome P450
70 qilexmiraassembly_c100372 CHR24 -3,826 0,005 Protein CHROMATIN REMODELING 24
71 qilexmiraassembly_c113178 GST3 -3,916 0,044 Glutathione S-transferase 3
72 qilexmiraassembly_c223111 rbp1 -4,004 0,044 Peroxidase
73 qilexmiraassembly_c208868 NEC4 -4,088 0,044 Nectarin IV
74 qilexmiraassembly_c160420 NTF2 -4,282 0,001 Nuclear transport factor 2
75 qilexmiraassembly_c183689 RPS15A -4,326 0,046 40S ribosomal protein S15-1
76 qilexmiraassembly_c26850 LSM1B -4,555 0,016 Sm-like protein LSM1B
77 qilexmiraassembly_dn_c28238 PRMT10 -4,699 0,046 Protein arginine N-methyltransferase PRMT10
78 qilexmiraassembly_c31712 snrpf -4,700 0,029 Small nuclear ribonucleoprotein F
79 qilexmiraassembly_c124551 Sb03g038260 -4,850 0,023 Putative uncharacterized protein Sb03g038260
pág. 46
80 qilexmiraassembly_c147600 PFK4 -4,862 0,044 ATP-dependent 6-phosphofructokinase 4, Chloroplastic
81 qilexmiraassembly_c49396 ubi3 -4,971 0,039 Ubiquitin 82 qilexmiraassembly_c109506 pan -5,013 0,021 26S protease regulatory subunit 4 83 qilexmiraassembly_c157838 UGT73B12 -5,174 0,044 Glycosyltransferase 84 qilexmiraassembly_c153571 GLIP5 -5,197 0,008 GDSL esterase/lipase 5 85 qilexmiraassembly_c377716 TMVRN -5,379 0,023 TMV resistance protein N 86 qilexmiraassembly_c149492 ck1 -5,862 0,045 Choline kinase 87 qilexmiraassembly_c8087 cen -5,901 0,017 Centrin-1 88 qilexmiraassembly_c59927 RPS30A -5,908 0,044 40S ribosomal protein S30 89 qilexmiraassembly_c48651 SGT1B -6,091 0,039 Protein SGT1 homolog B 90 qilexmiraassembly_dn_c1358 ce1 -6,389 0,039 Centrin
Pág.47
Ilustración 15. Ontología Génica de las funciones moleculares. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.
pág. 48
Ilustración 16. Ontología Génica de los procesos biológicos. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.
pág. 49
Ilustración 17. Ontología Génica de los componentes celulares. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.