INTRODUCCIÓN A LA BIOINFORMÁTICA 16/09/08 Introducción a la Bioinformática 1.

Post on 03-Jan-2015

11 views 1 download

Transcript of INTRODUCCIÓN A LA BIOINFORMÁTICA 16/09/08 Introducción a la Bioinformática 1.

INTRODUCCIÓN A LA BIOINFORMÁTICA

16/09/08 Introducción a la Bioinformática 1

Esquema de la exposición

16/09/08 Introducción a la Bioinformática 2

Introducción: La explosión de información

Sobre información biológica

Pero,… qué es la bioinformática?

Los grandes bloques temáticos de la BIF

Los grandes centros y bancos de datos

Una explosión de información

16/09/08 Introducción a la Bioinformática 3

Presentación

• El fin del siglo XX ha visto una explosión de información provinente de los seres vivos, especialmente en biología molecular– Secuenciación de genomas

– Secuencia y estructura de proteínas

– Estudios sobre la expresión simultánea de muchos genes bajo muchas condiciones diferentes

16/09/08 Introducción a la Bioinformática 4

Que es un gen? Es una secuencia lineal de nucleótidos en la molécula de ADN (o ARN en el caso

de algunos virus), que contiene la información necesaria para la síntesis de una

macromolécula con función celular específica. Por ejemplo: Proteínas, ARNm,

ARN ribosómico, ARN de transferencia y ARN pequeños.

Esta función puede estar vinculada al desarrollo o funcionamiento de una

función fisiológica normal. El gen es considerado como la unidad de

almacenamiento de información y unidad de herencia al transmitir esa

información a la descendencia. Los genes se disponen, pues, a lo largo de cada

uno de los cromosomas. Cada gen ocupa en el cromosoma una posición

determinada llamada locus.

El conjunto de cromosomas de una especie se denomina genoma.

16/09/08 Introducción a la Bioinformática

Qué es un genoma?• Una colección de

– genes• que codifican productos proteicos• que codifican RNAs

– pseudogenes– regiones no codificantes

• regulatorias (expresión)• estructurales

– attachment a matriz nuclear– mitosis / meiosis– elementos repetitivos

Crecimiento de GenBank

16/09/08 Introducción a la Bioinformática 7

En tan sólo 3 años la información se ha multiplicado por 4 (GenBank)

Estructuras de Proteínas Crecimiento de PDB

16/09/08 Introducción a la Bioinformática 8

Información actualizada (Pdb)

La información biológica

16/09/08 Introducción a la Bioinformática 9

La información biológica

• La información biológica se encuentra– codificada en los genes y – se expresa a partir / mediante los genes

• Esta idea se refleja en el Dogma Central de la Biología Molecular

16/09/08 Introducción a la Bioinformática 10

16/09/08 Introducción a la Bioinformática 11

El dogma central

Información biológica y bioinformática

• La biología se enfrenta con el problema de la decodificación del lenguaje biológico– Como se codifica la información en los genes?– Como (cuando, ...) se traduce esta

información?• Ej. Splicing alternativo

– Qué determina la estructura de las proteínas?– Como se determina la función de las proteínas

• La bioinformática sirve para estudiar como se procesa toda esta información biológica

16/09/08 Introducción a la Bioinformática 12

16/09/08 Introducción a la Bioinformática 13

La información biológica

• Los ácidos nucleicos (AN) contienen la información para generar los organismos:

DNA RNA PROTEINAS Función

• Las proteínas se forman con aminoácidos (AA) unidos en secuencias lineales

• Las instrucciones para definir la secuencia de AA están codificadas en los AN por grupos de tres nucleótidos, en un código genético redundante

16/09/08 Introducción a la Bioinformática 14

El código genético

16/09/08 Introducción a la Bioinformática 15

Codificación de información biológica

• Las secuencias biológicas se organizan en grupos con un significado, en general desconocido para nosotros

• Podemos distinguir una jerarquía (niveles de organización) que podemos comparar con– Frases (las proteínas)– Palabras (motivos o configuraciones)– Letras (Los AA o los nucleótidos)

16/09/08 Introducción a la Bioinformática 16

Descifrado de la información biológica

• Las secuencias, establecidas experimentalmente se representan como cadenas de un alfabeto y se comparan

– Regiones comunes asocian las palabras a propiedades comunes de las moléculas

– Regiones diferentes revelan palabras con un sentido asociado a propiedades que diferencian a las moléculas

– Muchas regiones no contienen información

16/09/08 Introducción a la Bioinformática 17

Pero, ¿qué es la bioinformática?

16/09/08 Introducción a la Bioinformática 18

¿Qué es la bioinformática?

• La bioinformática nace como una disciplina a caballo entre muchas ciencias

• Por este motivo encontramos muchas definiciones según su procedencia, o según el aspecto sobre el que se ponga más énfasis

16/09/08 Introducción a la Bioinformática 19

Una definición de Bioinformática

• Aplicación de las tecnologías de la información en Biología Molecular

• Esto incluye la recogida, mantenimiento, distribución, análisis y uso de las inmensas cantidades de información biológica disponibles

• Podemos encontrar muchas variaciones sobre la definición

16/09/08 Introducción a la Bioinformática 20

Más definiciones...

• El estudio del contenido y el flujo de información en los sistemas y procesos biológicos

• El estudio de la estructura inherente a la información biológica

• La disciplina del uso de ordenadores para estudiar problemas biológicos. Incluye la creación de bases de datos de genomas, secuencias de proteínas, etc...

16/09/08 Introducción a la Bioinformática 21

16/09/08 Introducción a la Bioinformática 22

"La bioinformática comprende los métodos matemáticos,estadísticos y computacionales que pretenden solucionarproblemas biológicos usando secuencias de ADN y aminoácidos e información relacionada"

Fredj Tekaia - Instituto Pasteur

“La bioinformática es el estudio de la información biológica desde su almacenamiento en el genoma hasta la obtención de los productos génicos en la célula” esto involucra la creación ydesarrollo de tecnologías informáticas y computacionales para la resolución de problemas en biología molecular”

Stanford Center for Profesional Development

Más definiciones...(2)

16/09/08 Introducción a la Bioinformática 23

Para saber más:

• Existen multitud de recursos gratuitos: – Bioinformatics: Courses&ressources

• Una gran variedad de libros sobre el tema– List of books on bioinformatics

• Y, como no, varias revistas y sociedades científicas dedicadas al tema– Bioinformatics, BMC Bioinformatics– International Society for Computational Biology

16/09/08 Introducción a la Bioinformática 24

Los bloques temáticos de la bioinformática

16/09/08 Introducción a la Bioinformática 25

Los bloques temáticos de la BIF (1)

• Organización de la información– Creación y mantenimiento de bases y bancos de datos

• Acceso a la información– Búsqueda de información en bases de datos– Comparación de información con la de las bases de datos

• Algoritmia– Algoritmos de búsqueda, alineamientos,…

16/09/08 Introducción a la Bioinformática 26

Los bloques temáticos de la BIF (2)

• Búsqueda de genes– Modelización y análisis estadístico– Programación dinámica (ensamblado)

• Proteómica– Estudio de la estructura de las proteínas– Predicción de la función de las proteínas

• Genómica– Genómica comparativa– Genómica funcional

16/09/08 Introducción a la Bioinformática 27

Los centros de bioinformática y los bancos de datos

16/09/08 Introducción a la Bioinformática 28

16/09/08 Introducción a la Bioinformática

Bases de datos: introducción: conceptos básicos

Qué es una base de datos? Una colección de datos

Cómo colecciono los datos? Decisión del usuario. Diseño de la base de datos.

Procesador de texto? (Word) Si. Permite sólo búsqueda y ordenamiento simples

Planilla de Cálculo? (Excel) También. Como los datos están en columnas independientes, se puede ordenar en formas más complejas. Las búsquedas siguen siendo simples

Puedo usar:

Introducción: conceptos básicos: Registros

• Una colección de registros (records)• Cada registro tiene varios campos.

• Cada campo contiene información específica.

• Cada campo contiene datos de un tipo determinado.

– Ej: dinero,texto, números enteros, fechas, direcciones

• Cada registro tiene una clave primaria. Un identificador único que define al registro sin ambigüedad

gi Accession version date Genbank Division taxid organims Number of Chromosomes

6226959 NM_000014 3 01/06/2000 PRI 9606 homo sapiens 22 diploid + X+Y6226762 NM_000014 2 12/10/1999 PRI 9606 homo sapiens 22 diploid + X+Y

4557224 NM_000014 1 04/02/1999 PRI 9606 homo sapiens 22 diploid + X+Y41 X63129 1 06/06/1996 MAM 9913 bos taurus 29+X+Y

Planilla

Versión simple de una base de datos

Las bases de datos biológicas

• Buena parte del trabajo en bioinformática consiste en la construcción y/o explotación de bases de datos de información biológica

• Se usan, por ejemplo para:– Añadir o buscar información (“anotaciones”)– Buscar similitudes o patrones– Hacer predicciones

• De estructura o función en proteínas• De genes en genomas

16/09/08 Introducción a la Bioinformática 31

El acceso a los recursos

• La WWW ha revolucionado la provisión de servicios en bioinformática

• Muchas cosas pueden hacerse a través de internet sin que sean necesarias copias locales de las bases de datos o el software para explotarlas

• A pesar de esta globalización existen organizaciones que centralizan los recursos

16/09/08 Introducción a la Bioinformática 32

Centros y recursos importantes

• Centros importantes a nivel mundial– EMBL / EBI (www.embl.org / www.ebi.ac.uk )

– NCBI ( www.ncbi.nlm.nih.gov )– DDBJ ( www.ddbj.nig.ac.jp )

• Bases de datos biológicas– EMBL DNA sequence database– SWISSPROT i TREMBL– PIR, PDB– Catálogo de bases de datos biológicas

www.infobiogen.fr/services/dbcat

16/09/08 Introducción a la Bioinformática 33

Centro Sanger

16/09/08 Introducción a la Bioinformática 34

Haz clic aquí para ver la página original