PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C....

33
PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico Sánchez y Orlando Santillan Bioinformática Aplicada

Transcript of PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C....

Page 1: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico Sánchez y Orlando Santillan

Bioinformática Aplicada

Page 2: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

•La regulación génica es vital para todo ser vivo.

•El inicio de la transcripción es el principal evento regulado por la mayoría de organismos que contienen DNA.

•Las bacterias tienen terminación transcripcional: intrínseca y factor-dependiente.

•La atenuación actúa principalmente en operones de biosíntesis de aminoácidos. Estos operones cuentan con una región líder donde se encuentran pequeños péptidos relacionados con los genes estructurales de éstos. La conservación, adaptabilidad y el bajo coste económico hace de la atenuación un proceso de gran relevancia para el estudio de la regulación génica en procariontes.

Datos importantes

Page 3: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Se reconocen 2 formas distintas para el control del inicio de la transcripción: a) Control Regulador (depende de proteínas) y b) Control Constitutivo (estructura del promotor).

La terminación transcripcional puede ser: intrínseca o factor-dependiente.

Nosotros nos enfocaremos en la terminación intrínseca, más específicamente en la atenuación para predecir péptidos líder pero...¿qué es la atenuación y los péptidos líder?

En bacterias...

Page 4: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Antes de contestar....

La terminación intrínseca sucede en regiones donde el DNA cuenta con una secuencia palíndromo invertido seguida de una serie de adeninas, cuyo RNA es capaz de formar “tallos-asa” y, aunado al tracto de poliU, debilitar la interacción DNA-RNA e interferir al mismo tiempo con la polimerasa, facilitando de este modo la disociación.

Es la suma de todas estas condiciones lo que favorece el término de la transcripción sobre la elongación

Page 5: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 6: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Nos acercamos a la respuesta

Se conocen 2 mecanismos para el control elongación/terminación transcripcional: antiterminación y atenuación.

Antiterminación

Ocurre cuando la polimerasa ignora una señal de terminación y prosigue elongando el transcrito hasta que una segunda señal es detectada. Este proceso es controlado por una proteína. Permite a la célula:

• Activar o reprimir la expresión de genes al final de un operón

Page 7: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Se piensa que dicha proteína desestabiliza al terminador intrínseco o previene la unión de Rho, según sea el caso .

Page 8: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Por fin... ¡Atenuación!

La atenuación actúa principalmente en operones de biosíntesis de aminoácidos. Las regiones líder -contenidas en el promotor- generalmente contienen péptidos relevantes (péptidos líder) para el operón transcrito.

Operon de triptofano en E. coli. El péptido líder poseen 14 aminoácidos, de los cuales 2 son triptofanos

Page 9: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Operon de triptofano en E. coli

Se pueden formar dos estructuras tallo-asa mutuamente excluyentes, una al inicio del transcrito (terminador) y otra (atenuador) al inicio del gen trpE. Si la cantidad de triptofano libre es limitada, el ribosoma se parará (intentando sintetizar el péptido líder) mientras la polimerasa sigue haciendo transcrito, lo que impide la formación del terminador. Pero si el ribosoma sigue a la polimerasa, el terminador si podrá formarse y la transcripción terminará.

Page 10: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Atenuación en el operón de triptofano de E. coli

Page 11: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Ventajas de la Atenuación

• Secuencias cortas y únicas de RNA -estructuras secundarias- pueden mediar decisiones cruciales para la expresión de los genes contenidos en operones

• Estrategia de regulación común y se encuentra conservada entre genes ortólogos de especies filogenéticamente distantes

•Los operones donde ocurre atenuación siempre cuentan con péptidos líder

•Fácilmente adaptable a las necesidades de regulación transcripcional

Page 12: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 13: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 14: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 15: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

ObjetivosObjetivos

Dada la importancia y conservación de la Dada la importancia y conservación de la atenuación en el proceso de regulación atenuación en el proceso de regulación

génica en procariontes, se buscan génica en procariontes, se buscan características , que nos permitan la características , que nos permitan la

identificación y identificación y posible predicciónposible predicción de de péptidos líder.,péptidos líder.,

Page 16: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Pitacora por Pitoches s.a. de c.c.g parque acuáticoTodos los programas utilizados en este trabajo fueron realizados por nuestra compañía con el fin de poder controlar todos los parámetros en cada uno de los filtros utilizados

SET DE PROGRAMAS AIDA.pl

FRECAA

A rtilugios de

I dentificación

D e

tr A nscripción por

p éptido

l íder

CONTROLER

UTILIZABLE

NACO

ORFERNOCOPY

MERINAZO

GC.CONT

D

Page 17: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Controler.plControler.pl

El programa El programa controler.plcontroler.pl es un programa es un programa con el que se saca de “E_coli_K12.list” los con el que se saca de “E_coli_K12.list” los péptidos líder que ya estuvieran anotados péptidos líder que ya estuvieran anotados y saca la región intergénica para el y saca la región intergénica para el siguiente gen tomando en cuenta su siguiente gen tomando en cuenta su dirección (F o R). Estos fueron usados dirección (F o R). Estos fueron usados como control checando que después de como control checando que después de cada filtro fueran mantenidos en nuestro cada filtro fueran mantenidos en nuestro set de datos. set de datos.

Page 18: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 19: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Utilizable.plUtilizable.pl

El programa utilizable.pl lee El programa utilizable.pl lee “E_coli_K12.list” y saca toda la secuencia “E_coli_K12.list” y saca toda la secuencia codificante de “E_coli_K12.dna”. Genera codificante de “E_coli_K12.dna”. Genera una secuencia continua, esta, se va una secuencia continua, esta, se va leyendo por codones, obteniendo la media leyendo por codones, obteniendo la media y la desviación estándar del contendido de y la desviación estándar del contendido de GC por posiciones de codón. Además GC por posiciones de codón. Además manda esa secuencia codificante a un manda esa secuencia codificante a un archivo. Que nos sera de utilidad más archivo. Que nos sera de utilidad más adelante adelante

Page 20: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 21: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Naco.plNaco.pl El programa naco.pl saca los ID's de todos los genes (no se tomaron solo El programa naco.pl saca los ID's de todos los genes (no se tomaron solo

los operones porque algunos de nuestros controles no venían anotados los operones porque algunos de nuestros controles no venían anotados como tal) que estaban en la lista de como tal) que estaban en la lista de OPERONS. OPERONS. En esta lista nos dan el ID En esta lista nos dan el ID si esta en “F” o en “R” y si forma parte de un operón, en caso de que si si esta en “F” o en “R” y si forma parte de un operón, en caso de que si formara parte, distingue si estaba en “R” o “F” y se tomaba solo la posición formara parte, distingue si estaba en “R” o “F” y se tomaba solo la posición importante.importante.

Con esos Id, recupera las posiciones de dichos genes del archivo Con esos Id, recupera las posiciones de dichos genes del archivo “E_coli_K12.list” verificando, así mismo, la dirección de cada ID obtenido y “E_coli_K12.list” verificando, así mismo, la dirección de cada ID obtenido y las posiciones dentro del genoma. Se guardo de tal manera que tomara la las posiciones dentro del genoma. Se guardo de tal manera que tomara la primera posición de los operones con dirección “forward” y el ultimo ID para primera posición de los operones con dirección “forward” y el ultimo ID para los “reverse”. los “reverse”.

Para cortar las regiones intergénicas, vimos que nuestros controles no eran Para cortar las regiones intergénicas, vimos que nuestros controles no eran muy distantes al próximo gen. Con las posiciones de cada gen, se corto del, muy distantes al próximo gen. Con las posiciones de cada gen, se corto del, regiones de 500bp río arriba, obviamente para los “reverse” se utilizaba la regiones de 500bp río arriba, obviamente para los “reverse” se utilizaba la secuencia correspondiente. secuencia correspondiente.

Con este programa se obtuvo una lista de 2722 regiones intergénicas, sin Con este programa se obtuvo una lista de 2722 regiones intergénicas, sin limpiar algunas que sobrelapaban por distintos marcos de lectura.limpiar algunas que sobrelapaban por distintos marcos de lectura.

Page 22: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 23: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Orfer.plOrfer.pl

El El orfer.plorfer.pl es un programa que saca todos los es un programa que saca todos los posibles marcos de lectura en las regiones posibles marcos de lectura en las regiones intergénicas, lo que hace es ir avanzando hasta intergénicas, lo que hace es ir avanzando hasta encontrar una metionina y después avanzar de encontrar una metionina y después avanzar de 3 en 3 hasta encontrar un codón de paro, y al 3 en 3 hasta encontrar un codón de paro, y al revés para los que estén en “R”. Este programa revés para los que estén en “R”. Este programa tiene restricciones de tamaño para las tiene restricciones de tamaño para las secuencias que vaya encontrando, esto para secuencias que vaya encontrando, esto para favorecer los tamaños que puedan ser un favorecer los tamaños que puedan ser un péptido líder según la literatura. péptido líder según la literatura.

Page 24: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 25: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Nocopy.plNocopy.pl

Se hizo el nocopy.pl para purgar los resultados de Se hizo el nocopy.pl para purgar los resultados de naco.pl, ya que debido a la anotación de naco.pl, ya que debido a la anotación de OPERONS(archivos *.dllh) existen algunos genes que OPERONS(archivos *.dllh) existen algunos genes que están contiguos pero están anotados como genes están contiguos pero están anotados como genes individuales no como operones. Esto provoca cierto individuales no como operones. Esto provoca cierto sobrelape y por ende cierta redundancia al momento de sobrelape y por ende cierta redundancia al momento de tomar las regiones + - 500pb. La manera de resolverlo tomar las regiones + - 500pb. La manera de resolverlo que usa este programa es purgar esos resultados; lee el que usa este programa es purgar esos resultados; lee el archivo de salida de orfer.pl y se queda con solo la archivo de salida de orfer.pl y se queda con solo la primera aparición de cada “orf” debido a que seria sobre primera aparición de cada “orf” debido a que seria sobre el cual actuaria el péptido líder. Solo tomar el siguiente el cual actuaria el péptido líder. Solo tomar el siguiente gen para cada “orf”, que es la primera aparición.gen para cada “orf”, que es la primera aparición.

Page 26: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 27: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Merinazo.plMerinazo.pl

Realizamos un programa llamado Realizamos un programa llamado merinazo.pl que interesecta los resultados merinazo.pl que interesecta los resultados obtenidos por ENRIQUE MERINO con los obtenidos por ENRIQUE MERINO con los nuestros. Y nos quedamos con los que nuestros. Y nos quedamos con los que tengamos en común. Por alguna extraña tengamos en común. Por alguna extraña razón, algunos resultados salieron razón, algunos resultados salieron duplicados así que a este set de datos duplicados así que a este set de datos resultado también le corrimos el nocopy.pl resultado también le corrimos el nocopy.pl Después se usan dos vías simultaneas Después se usan dos vías simultaneas

Page 28: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 29: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Frecaa.plFrecaa.pl

lo que hace este programa es para cada “orf” saca la lo que hace este programa es para cada “orf” saca la frecuencia de cada aminoácido en este, después crea frecuencia de cada aminoácido en este, después crea una distribución para determinados patrones de una distribución para determinados patrones de secuencia, la distribución es hecha con 10,000 “orfs” al secuencia, la distribución es hecha con 10,000 “orfs” al azar de secuencia codificante que nos da el programa azar de secuencia codificante que nos da el programa utilizable.pl, a cada una de estas distribuciones se le utilizable.pl, a cada una de estas distribuciones se le saca la media y la distribución estándar, teniendo esto saca la media y la distribución estándar, teniendo esto se pondera cada uno de los patrones de secuencia, con se pondera cada uno de los patrones de secuencia, con la frecuencia que tendría en toda la secuencia la frecuencia que tendría en toda la secuencia codificante, si la ponderación cae dentro de 2 codificante, si la ponderación cae dentro de 2 desviaciones estándar se rechaza el parámetro. Si desviaciones estándar se rechaza el parámetro. Si alguno de los parámetros es aceptado el “orf” es alguno de los parámetros es aceptado el “orf” es aprobado. aprobado.

Page 30: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 31: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Gc.cont.plGc.cont.pl

Ya con la desviación estándar del utilizable.pl se crea un Ya con la desviación estándar del utilizable.pl se crea un rango de valores en los que puede caer cada “orf” para rango de valores en los que puede caer cada “orf” para cada una de las 3 posiciones del codón, saca el cada una de las 3 posiciones del codón, saca el contenido de GC para la primera, segunda y la tercera contenido de GC para la primera, segunda y la tercera posición de cada “orf” putativo. Para que un “orf” sea posición de cada “orf” putativo. Para que un “orf” sea aceptado los tres contenidos de GC tienen que estar aceptado los tres contenidos de GC tienen que estar dentro del rango del mínimo del valor de e.coli menos la dentro del rango del mínimo del valor de e.coli menos la desviación estándar, y el máximo la media de e.coli más desviación estándar, y el máximo la media de e.coli más una desviación estándar. Es dinámico puede tomar 1, 2 una desviación estándar. Es dinámico puede tomar 1, 2 desviaciones estándar, para nuestro trabajo fue utilizado desviaciones estándar, para nuestro trabajo fue utilizado el parámetro de solo 1 desviación estándar. Imprime el parámetro de solo 1 desviación estándar. Imprime antes de las secuencia de cada “orf”, valor de GC para antes de las secuencia de cada “orf”, valor de GC para primera segunda y tercera posición y que gen regula primera segunda y tercera posición y que gen regula

Page 32: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.
Page 33: PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Resultados Resultados dependiendo de la desviacion estandar y si paso por merinazo

=1 y merinazo ---------> 258 genes dentro de 1 desv. est y predichos por MerinoE_coli_K12.m.1.orfs

=2 y merinazo ---------> 1787 genes dentro de 2 desv. est y predichos por MerinoE_coli_K12.m.1.orfs

=1 ---------> 351 genes dentro de 1 desv. estE_coli_K12.m.2.orfs

=2 ---------> 2508 genes dentro de 2 desv. estE_coli_K12.m.2.orfs