Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos...

28
Anotación Automática Dante Travisany

Transcript of Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos...

Page 1: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Anotación Automática

Dante Travisany

Page 2: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Temas

• Pipeline

• Tools

• Bases de Datos

• Conceptos

• Ejemplos

• Ensembl

Page 3: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Identificación del Problema

• Virus : 15 – 20

• Bacteria 3000 - 5000

• Eucariontes: sobre los 10000

Page 4: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Pipeline

Pipeline• Unix

• Símbolo: |

• Segmentación

Page 5: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Tools• BLAST • InterProScan• AmiGO• Pathway Tools• Infernal• Glimmer• Critica• GeneMark• GeneWise• BedTools• Samtools• GenomicTools• KEGG-API

Page 6: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Base de Datos

BLAST DB Protein-KEGG-PRIAM-SWISSPROT-UNIPROT-NR

BLAST DB Nucleotide- NT- REFSEQ- RDP

InterProScan - Databases

- Pfam- SSF- Gene3D- TIGRfam

Page 7: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Nuevo Problema

• Gran cantidad de bases de datos.

• Errores en Anotación, doble anotación.

• Necesidad de Crear un vocabulario Controlado

• Gene Ontology, UniPROT, SwissPROT, InterProScan.

• Capacidad de realizar referencias cruzadas en las bases de datos.

Page 8: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Algunos Conceptos Importantes

• Gene Name

• Vocabulario Controlado

• IFAA

Page 9: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

GeneName:

Para cada Organismo existen gene names particulares, según la base de datos de Referencia.

HUGO:www.genenames.org

Page 10: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Gene Ontology ConsortiumGene Ontology:

Proyecto colaborativo entre variadas instituciones.

Vocabulario:EstructuradoPrecisoComún Controlado

Permite describir los roles de los genes y los productos génicos en cualquier organismo.

Page 11: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

División Gene Ontology

• Proceso Biológico

• Función Molecular

• Componente Celular

Page 12: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

COG - KOG

Page 13: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Idea

• Filtrar por bases de datos

• Generar una rutina automática capaz de iterar el proceso, para cada set de genes.

Page 14: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Tools & Databases

Page 15: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.
Page 16: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.
Page 17: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Resumen

• Hasta ahora, se han visto:

NGS sequencing.Assembly.Gene Prediction.Annotation (Databases).Automatic Annotation

Page 18: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Caso Transcriptómica

Page 19: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Nannochloropsis salina transcriptomics

Page 20: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.
Page 21: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.
Page 22: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

RNA processing and modification

Chromatin structure and dynamics

Energy production and conversion

Cell cycle control, cell division, chromosome partitioning

Amino acid transport and metabolism

Nucleotide transport and metabolism

Carbohydrate transport and metabolism

Coenzyme transport and metabolism

Lipid transport and metabolism

Translation, ribosomal structure and biogenesis

Transcription

Replication, recombination and repair

Cell wall/membrane/envelope biogenesis

Cell motility

Posttranslational modification, protein turnover, chaperones

Inorganic ion transport and metabolism

Secondary metabolites biosynthesis, transport and catabolism

General function prediction only

Function unknown

Signal transduction mechanisms

Intracellular trafficking, secretion, and vesicular transport

Defense mechanisms

Extracellular structures

Nuclear structure

Cytoskeleton

AB

CD

EF

GH

IJ

KL

MN

OP

QR

ST

UV

WY

Z

0 5 10 15 20 25

KOG Category N.salina v/s C.reindhardtii

N.salinaC.reindhartii

Category Percentage

KOG

Cate

gory

Page 23: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

23

GenDB

– Automatic Annotation System for Prokaryotic genomes

• Development for the University of Bielefeld since 2002.

• Modular system developed using an OOP and a relational database (O2DBI).

• Provide an Application program Interface (API).

Page 24: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

24

GenDB

• Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003

Page 25: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

25

GenDBPipeline

25

Page 26: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

26

GenDB

Page 27: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Ensembl

• Inicio:1999

• Objetivo: generar herramientas de anotación automática.

Ensembl Pipeline.

• Website:http://www.ensembl.org/

Page 28: Anotación Automática Dante Travisany. Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl.

Galaxy

• Workflows, para NGS sequence, web based.

http://galaxy.psu.edu/