PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas...

29
PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS? ÁNGEL MARTÍN MUNICIO Real Academia de Ciencias INTRODUCCIÓN La historia de la ciencia nos muestra el gran periodo de maduración del concepto de proteína, que se extiende des- de 1838 hasta el advenimiento de la bioquímica como campo independiente del conocimiento, al finalizar el pri- mer cuarto del siglo XX. A partir de entonces las proteí- nas fueron consideradas entidades moleculares fijas dota- das de propiedades químicas y físicas singulares, basadas en la existencia de tres niveles estructurales -estructura primaria, secundaria y terciaria—. A su definición contri- buyeron sobremanera las nuevas ideas y métodos que apor- tó el nacimiento de la biología molecular. El estableci- miento del concepto de las relaciones estructura-función ha sido extraordinariamente fructífero para los estudios de la actividad de las proteínas, hasta que, con el conoci- miento de los genomas de una colección de especies, el hombre incluido, se han elaborado nuevas ideas y nuevos procedimientos para llegar a la comprensión de la fun- Bioslntesis de proteínas Transcripción Código genético FUNCIÓN de las proteínas método de homología Estructura de los aminoácidos Aminoácidos proteicos (20) Enlace peptídico Técnicas: cromatografía electroforesis Estructura T" Homología Especifidad BIOLOGÍA MOLECULAR Estructura - Función Secuenciación de DNA GENOMA r Síntesis de péptidos Estructura 2 " * / ? " | motivos estructúrale; pagamientos: errare ¡función de los GENES¡ Conexiones funcionales perfiles filogenéticos método de la piedra de Rosetta ingeniería de proteínas: nuevos sitios de unión péptidotecas ción de los genes. Y es precisamente este nuevo campo de conocimiento el que ha comenzado a conocerse como proteómica. La relación histórica de estas etapas se recoge en la tabla I. Ha sido así, pues, como, en el seno de la biología mo- lecular, gracias al amplio conjunto de conocimientos sobre la síntesis, estructura, propiedades, función y aplicaciones de las proteínas desarrollado en la segunda mitad del siglo XX, y tras la comprensión de Infundan de los genes y de los abundantes datos sobre las secuenciasgenómicas de distin- tas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, se ha desarrollado recientemente un nuevo ámbito de conocimiento: el complejo estudio del aná- lisis en gran escala de las proteínas y de sus relaciones fun- cionales. Este estudio se conoce actualmente, como se aca- ba de subrayar, con el nombre de proteómica. A pesar de la acumulación en las bases de datos de enor- mes cantidades de información acerca de las secuencias de DNA, ello no era suficiente para la elucidación de la función biológica. Y, por otro lado, no existe una estric- ta relación lineal entre los genes y el complemento de pro- teínas -el proteoma- de una célula. Efectivamente, el conocimiento actual de las secuen- cias genómicas de diversas especies permite enfocar la ín- La biología está pasando de ser una ciencia con fuerte componente analítico a ser una ciencia cuyo énfasis se desplaza hacia la integración de informaciones globales sobre la función celular a niveles diversos, para producir conocimientos relevantes sobre los procesos vitales -ob- tener información sobre el entramado global de las interacciones celulaTes 2. Las eras genómica y proteómica se caracterizan por los procesos de automatización y robotización (secuenciación, RMN, rayos X), micro- matrices de DNA (secuenciación por hibridación, chips de DNA), inte- racciones entre proteínas mediante técnicas experimentales y méto- dos computacionales (bioinformática). 3. Las matrices de DNA se basan en la idea de disponer en una pantalla de hibridación (chips de DNA) los 63 536 octámeros posibles en forma de una matriz reticular. Y un fragmento de DNA de varios centenares de bases hibridará solamente algunos de los octámeros, con lo que la secuencia podrá deducirse de forma computacional. 89

Transcript of PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas...

Page 1: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

ÁNGEL MARTÍN MUNICIO

Real Academia de Ciencias

INTRODUCCIÓN

La historia de la ciencia nos muestra el gran periodo demaduración del concepto de proteína, que se extiende des-de 1838 hasta el advenimiento de la bioquímica comocampo independiente del conocimiento, al finalizar el pri-mer cuarto del siglo XX. A partir de entonces las proteí-nas fueron consideradas entidades moleculares fijas dota-das de propiedades químicas y físicas singulares, basadasen la existencia de tres niveles estructurales -estructuraprimaria, secundaria y terciaria—. A su definición contri-buyeron sobremanera las nuevas ideas y métodos que apor-tó el nacimiento de la biología molecular. El estableci-miento del concepto de las relaciones estructura-función hasido extraordinariamente fructífero para los estudios dela actividad de las proteínas, hasta que, con el conoci-miento de los genomas de una colección de especies, elhombre incluido, se han elaborado nuevas ideas y nuevosprocedimientos para llegar a la comprensión de la fun-

Bioslntesis de proteínas

Transcripción

Código genético

FUNCIÓN de las proteínas

método de homología

Estructura de los aminoácidosAminoácidos proteicos (20)

Enlace peptídicoTécnicas: cromatografía

electroforesis

Estructura T"HomologíaEspecifidad

BIOLOGÍA MOLECULAR

Estructura - Función

Secuenciación de DNA

GENOMA r

Síntesis depéptidos

Estructura 2 " * /? " |

motivos estructúrale;pagamientos: errare

¡función de los GENES¡

Conexiones funcionalesperfiles filogenéticosmétodo de la piedra de Rosetta

ingeniería de proteínas: nuevos sitios de unión

péptidotecas

ción de los genes. Y es precisamente este nuevo campo deconocimiento el que ha comenzado a conocerse comoproteómica. La relación histórica de estas etapas se recogeen la tabla I.

Ha sido así, pues, como, en el seno de la biología mo-lecular, gracias al amplio conjunto de conocimientos sobre lasíntesis, estructura, propiedades, función y aplicaciones delas proteínas desarrollado en la segunda mitad del siglo XX,y tras la comprensión de Infundan de los genes y de losabundantes datos sobre las secuenciasgenómicas de distin-tas especies, el hombre incluido, y de manera colindanteo, quizá, solapándose, se ha desarrollado recientemente unnuevo ámbito de conocimiento: el complejo estudio del aná-lisis en gran escala de las proteínas y de sus relaciones fun-cionales. Este estudio se conoce actualmente, como se aca-ba de subrayar, con el nombre de proteómica.

A pesar de la acumulación en las bases de datos de enor-mes cantidades de información acerca de las secuenciasde DNA, ello no era suficiente para la elucidación de lafunción biológica. Y, por otro lado, no existe una estric-ta relación lineal entre los genes y el complemento de pro-teínas -el proteoma- de una célula.

Efectivamente, el conocimiento actual de las secuen-cias genómicas de diversas especies permite enfocar la ín-

La biología está pasando de ser una ciencia con fuerte componenteanalítico a ser una ciencia cuyo énfasis se desplaza hacia la integraciónde informaciones globales sobre la función celular a niveles diversos,para producir conocimientos relevantes sobre los procesos vitales -ob-tener información sobre el entramado global de las interaccionescelulaTes

2. Las eras genómica y proteómica se caracterizan por los procesos deautomatización y robotización (secuenciación, RMN, rayos X), micro-matrices de DNA (secuenciación por hibridación, chips de DNA), inte-racciones entre proteínas mediante técnicas experimentales y méto-dos computacionales (bioinformática).

3. Las matrices de DNA se basan en la idea de disponer en una pantallade hibridación (chips de DNA) los 63 536 octámeros posibles en formade una matriz reticular. Y un fragmento de DNA de varios centenares debases hibridará solamente algunos de los octámeros, con lo que lasecuencia podrá deducirse de forma computacional.

89

Page 2: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

vestigación hacia la comprensión de la función de los genes;en particular, de los 40 000 o 50 000 genes que, aproxi-madamente, posee el hombre, y cuyos primeros borrado-res de las secuencias prácticamente completas —obtenidospor la empresa privada Celera y el sistema público ame-ricano— se acaban de hacer públicos a comienzos de 2001,aunque se desconozca la función de alrededor de sus dosterceras partes. Función compleja que, de otro lado, cons-tituye la base entera del comportamiento celular.

Con estas ideas generales se pueden ya anticipar resu-midas las diferencias fundamentales, que aparecen en la ta-bla II, entre los ya tradicionales -aunque recientes- estu-dios de las proteínas y los actuales objetivos que cumplela proteómica. Estas diferencias van a contemplarse, enprimer término, desde un punto de vista histórico y, des-pués, desde el ángulo de la ciencia biológica actual, al ladode las consecuencias que pueden deducirse en los aspec-tos curriculares y de la política de la ciencia.

El conjunto de temas que potencialmente componenlos tratamientos de la proteómica aparece en la tabla III.

• Análisis estructurales de las proteínas: estructuras primaria, secundariay terciaria

_l Identificación de proteínas:

• Geles monodimensionales y bidimensionales

• Chips de proteínas

U Función de proteínas:

• Ensayos de actividad enzimática

• Bioensayos de citoquinas y de receptor/ligando

• Análisis proteómico: noqueo génico, interferencia de RNA

• Análisis fenotípico

J Modificaciones postraduccionales: fosforilación, glicosilación, etc.

Separación diferencial bidimensional en geles:

• Aplicación a líquidos orgánicos (suero, orina)

• Aplicación a modificaciones postraduccionales

J Interacciones proteína-proteína:

• Información directa del DNA:

- Exhibición en fagos y ribosomas

- Fusiones péptido-RNA

• Identificación de proteínas:

- Purificación por afinidad

- Espectrometría de masas

• Medicina molecular:

• Proteínas como blanco de acción de medicamentos

• Medicamentos que actúan sobre las interacciones proteína-proteína

• Ensayos in vivo de proteínas recombinantes, anticuerpos e inhibidores

A N T E C E D E N T E S

Era, sin embargo, a comienzos del siglo XX, en 1903,cuando Rodríguez Carracido, en su Tratado de QuímicaBiológica, en el capítulo dedicado a los llamados «albu-minoides», hacía los siguientes comentarios:

Grandes analogías presentan las numerosas sustanciasincluidas en este grupo, y, sin embargo, su definición estan vaga, que tiene todos los caracteres de agrupación con-vencional, de la que nada se puede afirmar sin advertir ex-cepciones (...). Los albuminoides son los compuestos queforman la sustancia esencial y fundamental de la organiza-ción, por lo que se denominan también materias proteicas,como por su semejanza a la albúmina de la clara de huevose llaman materias albuminoideas. Son compuestos gene-ralmente sulfonitrogenados cuya composición centesimalpresenta considerables variaciones. Su carácter de coloidescada vez tiene menor valor para caracterizarlos, porque dis-ta mucho de serles exclusivo y, por otra parte, parece seraccidental, como en los demás cuerpos en los que se pre-senta, ante las proporciones en que se va revelando comoposible la cristalización de los albuminoides. Respecto a lafunción química, Berthelot los considera amidas comple-jas y Gautier, nitrilos, también complejos, pero estas opi-niones son por todo extremo insuficientes para definir-los (...). La extraordinaria flexibilidad de la materiaconstitutiva de los organismos para responder a todas lasexcitaciones del medio ambiente, reside, no sólo en lo ines-table de la molécula resultado de su enorme magnitud, sinotambién en la coexistencia de numerosos grupos funcio-nales, que siempre han de presentar un punto de ataque acualquiera de las acciones físico-químicas que sobre ellasincidan. Como el proceso biológico es resultante de accio-nes mecánicas, físicas y químicas, la doble escala progresi-va y regresiva de los albuminoides es la síntesis de toda laQuímica.

Y al describir el apartado correspondiente a la consti-tución de los albuminoides, afirma:

Las diferencias correspondientes a las varias reaccionescoloridas indican lo numerosos y variados que son los gru-pos moleculares integrantes de las multiformes materiasproteicas, y explican las dificultades que presenta el dis-cernir los eslabones de su enmarañada cadena, la cual, ade-más, es tan delicada que los reactivos químicos, aun los demenor energía, no obran como escalpelos que disecan susmoléculas, sino como hachas que las destrozan.

Y acerca de su magnitud molecular dice:

Para la resolución de este problema se han ensayado losprocedimientos físicos, y principalmente el crioscópico;pero, los resultados presentan tantos motivos de incerti-dumbre, que, no obstante su indeterminación, sólo se to-man en cuenta las magnitudes calculadas por los datos quí-micos. Liebetkühn, refiriendo a un átomo la proporcióncentesimal de azufre y corroborando este dato con el del aná-lisis de un albummato potásico, estableció el número 1612como peso molecular de la albúmina, representándola porla fórmula C7iH, I2NI8O_,S, la cual indudablemente es muybaja, pero todavía se usa en las reacciones bioquímicas cuan-do se exptesan metamorfosis de la albúmina, en las que,por no ser necesario, o por ignorancia del proceso, sólo sesimbolizan las relaciones cuantitativas que manifiestan la per-sistencia del peso de la materia transformada.

90

Page 3: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

Apartado que concluye con el comentario:

De todo lo expuesto se infiere que las moléculas albu-miiioideas son desmesuradas; pero que la determinaciónprecisa de sus magnitudes dista mucho de verse realizada,y, por consiguiente, que falta el primer dato para el estudiosistemático de sus transformaciones, que es el conocimientode las especies químicas.

Y en el capítulo referente a la formación de los albu-minoides, Carracido afirma:

A las plantas que tienen clorofila les bastan sustanciasminerales para su alimentación, y con ellas fabrican todossus principios inmediatos, incluso los complicadísimos al-buminoides. ¿Cuál es el mecanismo de esta asombrosa sín-tesis? La observación minuciosa de las condiciones en quela vida los elabora es la que puede dar la respuesta, peroantes de exponer los resultados obtenidos por este medioconviene anticipar para el mejor conocimiento de la índo-le del problema las tentativas de la experimentación en suafán de reproducir la obra de la Naturaleza.

Estos pocos retazos de la literatura científica del primercuarto del siglo XX evidencian la confusa situación que elconcepto de proteína ofrecía aún en esta época. Trasel descubrimiento por el holandés Mulder, en 1838, de lassustancias primeras entre los materiales de la vida —las pro-teínas- en numerosas fuentes animales y vegetales, estaépoca dejaba atrás todo un siglo de doctrinas vitalistas yespeculaciones pseudocientíficas basadas en la llamadabiocoloidología. A este descubrimiento se refirió Liebig,una de las autoridades químicas de la época, al asegurar que«abrió un universo de nuevos descubrimientos»; pero ellono fue inconveniente para que, a la vez, manifestara sudiscrepancia con la idea de proteína como «sustancia mo-lecular ordinaria cuya fórmula pudiera determinarse porlos métodos ordinarios de la química». Y esta época se en-frentaba, además, con el establecimiento por Fischer de lateoríapeptídíca, que había de constituirse en el paradigmade todos los estudios conducentes al reconocimiento de lasproteínas corno macromoléculas bien definidas.

EN BUSCA DEL ARGUMENTO BIOLÓGICO UNIFICADOR

Durante casi un siglo, de 1820 a 1918, se fueron aislandoe identificando sucesivamente, con diferentes técnicas dehidrólisis, cada uno de los aminoácidos constituyentesde las proteínas, de fonna que la hipótesis química de lateoríapeptídica quedaba del todo fortalecida, en busca delmodo de asociación de los aminoácidos en la estructuraglobal. Y, una vez afirmado el concepto de macromolécu-la, debido principalmente a las ideas y los métodos deStaudinger y Svedberg, en el segundo cuarto del siglo XX,faltaba un argumento profundamente biológico capaz de en-garzar los principios estructurales, la especificidad funcionaly los esquemas de biosíntesis.

Esta falta de argumento biológico unificador sirve paracomprender que, a pesar del esfuerzo de los más ilustresquímicos orgánicos de la época —Abderhalden, Willstát-ter, Karrer, etc.—, Osborne pudiera afirmar «como, trasuna abrumadora cantidad de trabajo, no se haya prácti-camente progresado en los aspectos fundamentales de laestructura de la molécula de las proteínas»; argumenta-ción biológica que, de otro lado, se vio soportada, en la dé-cada de los cuarenta del siglo XX, por el desarrollo de nue-vos conceptos y métodos para su investigación, basadosfundamentalmente en las técnicas isotópicas y en los va-riados procedimientos cromatográficos.

Para situarnos correctamente en el tiempo de estos he-chos, recordemos que eran ya los comienzos de la segun-da mitad del siglo cuando Pauling publicaba una colecciónde datos acerca de las distancias interatómicas, los ángulosde enlace, la coplanaridad del sistema amídico -CONH- yotras propiedades de los polipéptidos sintéticos, comoideas precursoras de la estabilización de la estructura de lasmacromoléculas por los enlaces de hidrógeno y, a la vez, delas configuraciones helicoidales de las cadenas. Hubo que es-perar, sin embargo, a la filigrana experimental químico-en-zimática de los trabajos de Sanger sobre la estructura dela insulina, de 1952, para probar definitivamente la teo-ría peptídica. En aquellos años, de todas maneras, la bio-síntesis del enlace peptídico se buscaba a través de la re-versibilidad de su escisión hidrolítica enzimática y deldesplazamiento del equilibrio por variación de las pro-piedades físicas de los productos sintetizados. Y, aunquecada vez más cercano, seguía faltando el argumento bioló-gico unificador de ideas.

Seguramente, la etapa definitiva en esta búsqueda sur-gió del conocimiento de la estructura y función de los áci-dos nucleicos; a propósito de lo cual cabe señalar que, si laprevia experiencia química y metodológica sobre la es-tructura de las proteínas pudo ser de cierta aplicación alconocimiento de los ácidos nucleicos, tuvieron que ser sunativa heterogeneidad de composición, tamaño y secuencia debases y su relación con la síntesis de las cadenas polipep-tídicas los conceptos moleculares inicialmente soporta-dores de la añorada idea biológica. Idea que conectaba lainformación contenida eyi el material genético y la especifi-cidad de la secuencia de las proteínas.

LA NUEVA CONCEPCIÓN BIOQUÍMICA

A la maduración de la idea anterior contribuyó una co-lección de aportaciones tales como la síntesis orgánica deesteres fosfóricos, la idea de derivados fosfóricos con eleva-das energías libres de hidrólisis, la activación química delos grupos carboxilo, y, en consecuencia, de los ácidos or-gánicos y los aminoácidos, la averiguación de la estructu-ra de la coenzima Ay\a introducción del concepto de ac-tivación biológica, la extensión de las técnicas de difracciónde rayos X, y la correlación entre la cantidad de RNA y lavelocidad de síntesis de proteínas. Aportaciones desde el

91

Page 4: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

DNA DNA

núcleo-

citoplasma

ribosoma

proteínanaciente

ribosoma

proteínanaciente

célula procariótica célula eucarióticaFig. 1

lado de la química que se completaron con la utilizaciónde tejidos, células y preparaciones del fraccionamiento ce-lular para investigar el metabolismo intermediario y la in-corporación de aminoácidos con las nuevas técnicas iso-tópicas.

Y, a todo esto, nos encontramos en la década de los cin-cuenta, posiblemente la más fructífera en la aparición delfantástico campo independiente del conocimiento quesupuso la bioquímica. A partir de este momento, toda estamagnífica integración de conceptos y de métodos sirve yaa las propias circunstancias bioquímicas, con las tenden-cias o soportes que siempre tenderán hacia lo biológico ohacia lo químico. Del lado de lo biológico, las proteínasse conectan con el descubrimiento de los diferentes RNAs,las implicaciones genéticas del DNA y la naturaleza del có-digo genético. Del lado de lo químico va a tener que vercon la interpretación de los numerosos mecanismos deisomerización, condensación y transposición; la aromati-zación, desaromatización y rotura de los anillos aromáti-cos; la apertura de ciclos; las reacciones de activación defragmentos de 1C, 2C y 5C; la degradación C a C de lascomplicadas estructuras de esteroides, porfirinas y corri-nas; las reacciones de polimerización a melanina o cau-cho; y, a no dudarlo, la síntesis química de oligonucleo-tidos, tan decisiva en la averiguación del código genético.La figura 1 muestra, muy simplificadamente, los princi-pales aspectos comparados de las etapas principales de labiosíntesis de las proteínas -transcripción y traducción- enlas células procarióticas y las eucarióticas. La figura 2 re-sume los mecanismos del alargamiento sucesivo de la ca-dena polipeptídica en el seno de los ribosomas en los quese localizan las posiciones Py A, ajustadas por los corres-pondientes tripletes del mRNA. La síntesis se inicia porla colocación del f-metionil-tRNA, en el sitio -Py la entradaen A del aminoacil-tRNA,. La acción de lapeptidiltrans-ferasa cataliza la formación del primer péptido en el sitio

A, ocupado por el aminoacil-tRNA,. A continuación, elpeptidil-tRNA, recién formado se trasloca al sitio P, quese ha descargado del tRNAr, con lo que el sitio A quedalibre para la entrada del segundo aminoácido bajo la for-ma del aminoacil-tRNA,, de forma que se puede reco-menzar un nuevo ciclo de alargamiento de la cadena pep-tídica.

LOS NIVELES ESTRUCTURALES DE LAS PROTEÍNAS.

LA ESTRUCTURA PRIMARIA

La fácil aceptación por la bioquímica de los métodos yconceptos de la química y de la física hizo posible, en ladécada de los cincuenta, tanto la filigrana experimentalde los trabajos de Sanger sobre la insulina, que probó de-finitivamente la teoría peptídica, como la medida de suslongitudes interatómicas y la de los ángulos de enlace,que, merced sobre todo a los trabajos iniciales de Pauling,demostraron la naturaleza planar de este grupo funcionalpeptídico (figura 3). Por primera vez, con Sanger, se de-finió la estructura de una proteína, la insulina (figura 4),pero, con todo lo que este hecho aportaba en aquel mo-mento, fue mucho más relevante la introducción de unametodología original para la determinación de la estruc-tura primaria de las cadenas polipeptídicas, conjugando losmétodos químicos con los enzimáticos, la determinaciónde los puentes disulfuro, las hidrólisis parciales, las mo-dificaciones específicas de los aminoácidos y la separacióne identificación de numerosos productos de degradación.Todo este conjunto de facetas parciales de la química deproteínas no puede desvincularse de otra serie de hechosque contribuyeron decisivamente al impulso de la quí-mica moderna; se trata de las múltiples variantes de losprocedimientos cromatográficosy electroforéticos de separación,con los que Tiselius, Martin y Synge, y Moore y Stein,

92

Page 5: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

aminoácido

A

C 5'

3'

fMet

sitio P

fMet Arg

O•AUG —CGA-J- GCU -3'

formación del primerpéptido catalizado porla peptidiltransferasa

fMet

IArg

liberación deltRNA libre

fMet

sitio A libre

translocación

GDP+P,

GTP

O•AUG V C G A — G C U / GCU

Fig. 2

pusieron a disposición de la bioquímica las herramientasmás decisivas de su progreso en las últimas décadas. En-tre otros, la electroforesis en gel de agar (1949), en papel(1950), en almidón (1952) y engeldepoliacrilamida{\959);el electroenfoque que aprovecha las diferencias en los pun-tos isoeléctricos de los componentes de una mezcla paralograr su separación en un gradiente estable de pH; y laisotacoforesis que aprovecha el gradiente de valores de pK,para, a pH constante, lograr un gradiente de movilidadeselectroforéticas. Efectivamente, las técnicas electroforéticashan constituido herramientas fundamentales en la inves-tigación bioquímica para la separación de proteínas muysemejantes, como las isoenzimas de carga o las que resul-tan en los procesos de desamidación durante el envejeci-

miento. Los procedimientos cromatográficos tuvieron susprimeros fundamentos en la separación de moléculas, enparticular de pigmentos vegetales, llevada a cabo hace unacenturia por el ruso Tsvett utilizando lechos de óxido dealuminio o de carbonato calcico. Estos trabajos perma-necieron olvidados hasta que, tras un cuarto de siglo, gran-des químicos como Willstá'ter, Kuhn y Lederer reutiliza-ron la misma técnica. En la década de los cuarenta, Martiny Synge desarrollaron la cromatografía sobre papel; y Mar-tin y James, en 1952, la cromatografía de gases. Por los mis-mos años, Moore y Stein desarrollaron la cromatografíade cambio de ion, procedimiento extraordinario para la se-paración y cuantificación de aminoácidos en sus mezclas,principalmente en hidrolizados de proteínas.

93

Page 6: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

grupo peptídico

H H

-N — C —

R,

0

C—N

H

0

C—N

H 0

— C—

H i R-.

H H 0 H H 0

— N —C—C — N — C- -C —N -C--C —N —C —C—N— C—C —

R, 0 H R3 0 H Rr 00

Fig. 3

63 (

ANH3

+ (

lAsn)

cadena B

péptido de conexión50

jGln)

iL

s

10 -'VÍSAGI^/AI,

s,

P^^ys'Ser't-eu1 yr

10cadena A

/ S

insulina

W - . 4 0(Glyl

COO" (G|^

.Jr20 *w^ B ] (Ala)

:dP S j ^

1

Fig. 4

94

Page 7: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

0 10 20 30 40 cm

0f n i i i i . i ^ n , |

registro

O 9 9 9 9

termostato bombas- Fig. 5

Este procedimiento de separación, y su ulterior cuanti-ficación por la reacción coloreada con ninhidrina, ha cons-tituido la base de los analizadores automáticos de aminoá-cidos, cuyo esquema aparece en la figura 5. El uso de losanalizadores de aminoácidos y el cálculo de masas mo-leculares por ultracentrifugación permitieron conocer lafórmula empírica de las proteínas, lo que significó indu-dablemente un cierto avance; pero, a diferencia de lo queocurre con la generalidad de las moléculas, este conoci-miento es poco relevante para penetrar en la compleja es-tructura de las proteínas y la averiguación de sus distin-tos niveles estructurales.

La denominada estructura primaria se refiere a la orde-nación secuencial que los aminoácidos presentan a lo lar-go de la cadena polipeptídica; lo que constituye, como yaha quedado representado en la figura 1, la traducción dela información contenida en los mRNA, soportada poruna secuencia de bases, en la secuencia de los aminoácidos,específica para cada molécula de proteínas. Esta especifi-cidad es doble; de un lado, la debida a la actividad bioló-gica particular de la molécula -en orden a la catálisis, la de-fensa, el transporte de pequeñas moléculas, la variada acciónde los distintos tipos de receptores, los mecanismos de latransducción de señales, incluido el fenómeno de apopto-sis, etc.-; y, de otro, la propia especificidad de una especiebiológica determinada, de forma que la insulina del hom-bre, por ejemplo, difiere en su estructura primaria de la deotras especies, como el caballo, el cerdo, etc. El conoci-miento de esta diferencia entre las especies es esencial; enella radica la mayor o menor facilidad con que una de-terminada proteína no humana —podemos seguir con elmismo ejemplo de la insulina— puede utilizarse, en fun-ción de su respuesta inmunitaria, en la terapéutica hu-

mana y, por ende, la importancia de la fabricación bio-tecnológica de las proteínas humanas por bacterias trans-génicas.

Efectivamente, en 1945, Frederick Sanger inició un lar-go estudio que, en ocho años, le había de conducir al co-nocimiento de la secuencia de aminoácidos —la estructu-ra primaria— de la insulina. A dos circunstancias principalesse debió el éxito de este trabajo. En primer lugar, a que lainsulina carece de dos aminoácidos lábiles, la metioninay el triptófano, cuya presencia dificulta -lo hacía, sobretodo, en aquella época—, el tratamiento del conjunto; ensegundo, a la puesta a punto de reactivos químicos —so-bre todo, el fluordinitrobenceno, el cloruro de dansilo yel cloruro de dabsilo- (figura 6) que, aunque ya en desu-so, son capaces de bloquear de manera bastante selectivala posición -NH 2 terminal de la molécula. A la determi-nación de la estructura primaria de la insulina siguieronlas determinaciones de la ribonucleasa con 124 aminoáci-dos en una sola cadena, del virus del mosaico del tabaco, dela tripsina, y un largo etcétera que hoy abarca a muchísi-mos cientos de cadenas polipeptídicas.

Sin embargo, las condiciones químicas se vieron me-joradas enseguida por un nuevo reactivo que signifi-có un extraordinario avance, el isotiocianato de fenilo,S=C=N-QH,, descrito por Edman en 1950 (figura 7). Elmismo autor describió, diecisiete años después, la auto-matización de la determinación de la secuencia de ami-noácidos en fase líquida (figura 8), a cuya técnica han se-guido nuevos sistemas que operan en fase sólida o, másrecientemente, en fase gaseosa. En el sentenciador que apa-rece en la figura 8, la proteína objeto de estudio se colo-ca sobre las paredes de una cámara termostatizada dereacción por efecto de un campo centrífugo, en la que tiene

95

Page 8: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

cloruro de dabsilo

•N = N

H 0

+ H2N — C—C —Gly - Asp — Phe — Arg — Gly —C\

CH5

H H O

mareaje

S02 —N —C —C —Gly — Asp — Phe — Arg — Gly — C '

hidrólisis

H3CH H O

SO2— N — C— C - O "

CH,

Gly Phe GlyAsp Arg

Fig. 6

H O H O

N = C = S + hUN — C — C — N — C — C — N

¡sotiocianatode fenilo aminoácido N-term¡nal

H O H O

N — C — N C - C — N — C — C — NH H H H

R, R2

feniltiocarbamil (PTC) derivado

F.C-COOH

otiazolinona

ácido

NH

\ /C — C -

O

H O

^ C — C— N-H

(n-1) aminoácidos

repetición deltratamiento

Fig. 7

96

Page 9: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

línea de recogida_de productos

- copa de reacción línea de suministro de reactivosy disolventes

V J V

Fig. 8

lugar la adición y liberación programada de reactivos, pro-ductos y disolventes en una combinación de periodos devacío y sobrepresión de nitrógeno. Con este tipo de apa-ratos, y debido al alto rendimiento de la reacción de Ed-man, se ha llegado a realizar más de un centenar de ciclosde degradación secuencial de una cadena polipeptídica.Y, cuando las proteínas son de gran tamaño, la determi-nación de su estructura primaria requiere varias etapascomplementarias, como pueden ser la rotura de los puen-tes disulfuro, la rotura de cadenas por la acción de reactivosespecíficos como el bromuro de cianógeno sobre los resi-duos de metionina y la acción de enzimasproteolíticas conactividades específicas de rotura -pepsina, tripsina, qui-motripsina, termolisina, principalmente-, para lograr frag-mentos capaces de ser sometidos más eficazmente a la ac-ción del secuenciador automático. Su mayor limitaciónestriba en la solubilidad de algunos péptidos, sobre todode los de bajo peso molecular, que se arrastran excesiva-mente por los disolventes, con la consiguiente reduccióndel rendimiento. Este inconveniente se ha salvado con eldesarrollo de la degradación de Edman en fase sólida, en laque los péptidos, cualquiera que sea su tamaño o solubi-lidad, se fijan de forma covalente a soportes insolubles, yla vasija de reacción se sustituye por una columna quecontiene el problema unido al soporte. Más recientementese ha descrito un procedimiento que combina la degra-dación automática en fase sólida con el empleo de reacti-vos en fase gaseosa para el acoplamiento y posterior rup-tura; en él, la proteína o péptido se insolubiliza sobre lamatriz de un polímero que se sitúa sobre una placa poro-sa de teflón, a través de la que circulan reactivos y disol-ventes. Frente a los dos sistemas iniciales presenta ciertas

ventajas: frente al sistema en fase líquida, la de utilizarcantidades mucho más pequeñas —del orden de 5 pmolesen lugar de los 5 nmoles del anterior—, y frente al sistema enfase sólida, la de no necesitar la unión covalente de la ca-dena peptídica, con la consiguiente mejora del rendi-miento. Mediante el empleo de estas técnicas, los ochoaños que duró el trabajo de Sanger para la determinaciónde la estructura primaria de la insulina hubieran queda-do reducidos a unos cuantos días.

El conocimiento de la estructura primaria de las proteí-nas es fundamental para penetrar en los mecanismos de sufunción y, en consecuencia, para el establecimiento delas relaciones estructura-función. Porque en la estructura pri-maria descansa no sólo la especificidad funcional de las pro-teínas, como ha quedado subrayado, sino las posibilida-des de sus alteraciones patológicas de índole genética e,incluso, el origen de sus niveles superiores de estructura.Y, aunque sea adelantarse un tanto en este estudio, habráque señalar ahora que esta secuencia impone las condi-ciones de plegamiento de las cadenas para el logro de lasconformaciones nativas propias de la estructura terciaria.

SÍNTESIS DE PÉPTIDOS

La exactitud de los análisis estructurales tendría que ver-se confirmada por la correspondiente síntesis peptídica yla identidad del producto obtenido con el analizado. Yaen 1901, Fischer había iniciado los métodos químicos de sín-tesis de péptidos por medio de la activación químicade los carboxilos de los aminoácidos, utilizando los esteres,los cloruros o las azidas de ácido. Con estos procedimientos

97

Page 10: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

of-Boc — N - - C — C

H R ,

aminoácido, protegido

+ Cl CH;

0"

resina

f-Boc

H O

-N C - C — O CH

H R,

desprotección(F3C-COOH)

H O

I

H - N — C — C - - 0 - CH 2

/ / \ \

H R

adición deam¡noácido2 protegido

(DCC)

f-Boc — N C — C — N - - C - C — O - CH

H,N — N

H O

c — cI

Rn

etapas dedesprotección y

I adición

liberación (HF)

H

• N — C -

H R,

, 0

O'Fig. 9

clásicos de la química, logró Abderhalden, en 1916, sin-tetizar un nonadecapéptido. Sin embargo, la era moder-na de la síntesis de péptidos no comenzó hasta 1932, cuan-do Bergmann y Zervas introdujeron un método singularde protección del grupo - N H , de los aminoácidos pormedio del cloruro de benciloxicarbonilo, C6H,—CH,-O-COC1, que más tarde se amplió a la utilización del blo-queo por el terbutil-oxicarbonilo (t-BOC). La posterioractivación del grupo carboxilo mediante la formación deanhídridos mixtos o el empleo de la diciclohexil-carbo-

diimida han constituido variantes con las que se llevó a cabola síntesis de péptidos hasta que, en la década de los sesenta,Merrifield desarrolló la síntesis de péptidos en fase sólida.En este método (figura 9), el primer aminoácido, ade-cuadamente proregido en su grupo —NH,, se une a unaresina -constituida por un copolímero de 98 % de estirenoy 2 % de polivinilbenceno, con los anillos aromáticos par-cialmente clorometilados para originar el sitio de anclaje-,de forma que el posterior desbloqueo del -NH, del ami-noácido inicial permite la entrada del segundo aminoáci-

98

Page 11: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ;QUÉ SON Y PARA QUIÍ SIRVEN LAS PROTKINAS?

do igualmente protegido y en presencia de un agente decondensación como la diciclohexil-carbodiimida. Este co-nocimiento básico dio luEir al desarrollo del sintetizadorautomático depéptidos, con el que, en los años siguientes,se describió la síntesis de la ribonucleasa A (Merrifield), elcitocromo c (Sano y Kurihara), la ferredoxina (Bayer, Jungy Hagen) y la hormona de crecimiento (Li y Yamashiro).Ha sido en la síntesis de péptidos de bajo peso molecularde aplicación farmacológica, o en la producción de re-giones específicas con actividad antigénica para la pro-ducción de anticuerpos específicos y vacunas, donde elsintetizador ha alcanzado su máxima eficacia.

ESTRUCTURAS SECUNDARIA Y TERCIARIA

Hay que anticipar que los biopolímeros en general y lasproteínas en particular deben su funcionalidad a un con-

junto de interacciones no covalentes condicionadas porla singular disposición espacial de su estructura química.Y la difracción de rayos X comenzó a resultar útil para elanálisis estructural cuando, a comienzos del siglo XX, VonLaue descubrió que las distancias interatómicas de las re-des cristalinas eran del orden de la longitud de onda de losrayos X, y podían servir para experimentar los fenóme-nos de difracción, de cuya interpretación habrían de surgirlos datos acerca de las distribuciones atómicas de las redes.

En efecto, a finales de los años treinta, Linus Pauling yRobert Corey, en el Instituto Tecnológico de California,comenzaron un estudio sistemático de difracción de rayos Xcon aminoácidos, péptidos y proteínas, esencialmentede naturaleza fibrosa; de manera que en 1951 presentarondatos relativos a las distancias y ángulos de enlace de lascadenas polipeptídicas y elaboraron un modelo de estructu-ra helicoidal, cuya característica principal era la de conte-ner 3.6 residuos de aminoácido por cada giro (figura 10).

99

Page 12: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

Esta estructura de a-hélice resultó ser uno de los plega-mientos más habituales en la estructura de las proteínas.Esta disposición relativa en el espacio de dos aminoácidosconsecutivos se conoce como estructura secundaria o, si sequiere, repetición regular de ciertas conformaciones en el es-queleto peptídico. Por la misma época, Max Perutz y JohnKendrew dirigieron sus esfuerzos hacia la comprensiónde los datos de difracción de proteínas globulares crista-lizables, como fueron los casos de la hemoglobina y la mio-globina, las dos primeras proteínas globulares cuya es-tructura atómica detallada se pudo llegar a conocer(figura 11). Esta disposición molecular en el espacio en laque se establece la relación entre dos aminoácidos no con-

secutivos es la que se conoce como estructura terciaria.A partir de entonces han sido numerosísimas las es-

tructuras terciarias de proteínas identificadas a través delos esquemas de difracción de rayos X. Es el caso de diversasenzimas (lisozima, prostaglandina sintasa y otras sintasas,hidroxilasas, deshidrogenasas, fosfolipasas, adenilato cicla-sa, proteína quinasas, citocromo reductasas, caspasas, etc.),la albúmina'sérica, los transportadores de oxígeno, lasinmunoglobulinas y sus fragmentos, los factores de creci-miento, los receptores de los más variados ligandos (re-ceptores de células T-MHC, de hormonas, etc.), los canalesde iones, la bacteriorrodopsina, las moléculas implicadasen la transducción de señales, las proteínas y complejos fun-

posición decoordinación (6a)para ia unión del 02

HemoFig. 12

100

Page 13: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEOMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

puentes dlsulfurc*:''

regiones hipervanablede cadenas ligeras

1I1I 1

s

/

lori

cadenaligera

., ~^^^^W cadena~'^^^^^^p pesada

^^^f regiones^ ^ hipervanables/ de cadenas

pesadas

--- charnela

- unión de!complemento

—-•azúcar

Fig. 13

dónales de los ribosomas, las dtoquinas, las tubulinas, lasintegrinas, las dinaminas, las cadherinas y la maquinariamitótica.

Más recientemente, la espectroscopia de RMN está con-tribuyendo eficazmente a la determinación estructural delas proteínas.

La asociación, por lo general no covalente, de entidadesde proteínas con sus niveles estructurales respectivos, pri-mario, secundario y terciario, origina las llamadas estructurascuaternarias, de las que existen numerosos ejemplos dediferente complejidad.

A modo de ejemplo de estas estructuras cuaternarias po-demos citar: la hemoglobina (a2P2), a base de cuatro sub-

unidades —dos subunidades a y otras dos subunidades (3-con sus correspondientes niveles estructurales, cada una delas cuales interacciona con un anillo porfirínico que con-tiene Fe para el transporte y cesión del O2con arreglo a unmecanismo singular (figura 12); la inmunoglobulina G,que cumple sus funciones con unas estructuras singulares,entre otras las de la región charnela y las zonas hipervaria-bles, responsables de la variabilidad de la respuesta anti-génica en el seno de una original estructura a base de doscadenas pesadas y dos cadenas ligeras, con puentes disul-furo intra e inter-catenarios (figura 13); y las proteínas delas clases I y II del complejo principal de histocompatibili-dad, cuyas múltiples zonas responden a la necesidad delas interacciones moleculares en la presentación de antí-genos a las células T (figura 14).

En la actualidad, los bancos de datos sobre proteínasrecogen la información sobre el tamaño y la forma de másde un millar de moléculas.

TAMAÑO, FORMA Y FUNCIÓN.

NUEVAS ESTRUCTURAS Y NUEVAS FUNCIONES

Proteínas son los principales catalizadores, elementosestructurales, máquinas moleculares y transductores deseñales biológicas (tabla IV). La gran singularidad es-tructural de las proteínas radica en la multiplicidad de susniveles estructurales y en la extraordinaria variabilidadde cada uno de ellos; y como consecuencia de todo elloresulta un muestrario formidable de tamaños y formas,cuya relación con la función biológica resulta hoy difícilde evaluar.

Hasta época reciente existían dos métodos principalespara profundizar en la función de las moléculas de las pro-teínas. De un lado, el conocimiento primario de la fun-

antígenosclase I CHM

zona II

zona II

r\

zona transmembranar í

# =

\\ \\ \\ \ \ \ \ \\ y_ ÍDKÍJ

zonacitoplásmica

>?(f 1

¿yíllll\X\\\ IIIIIIII lili un

-"^^Oooo COOH

/ • zona 1

membrana celular

antígenos clase 1CHM

NH2¿

©

zona II

<

c^ 1w

COOH OOOO"^

IlttSWírWXCO-v-,

^DOOQOCOOH

Jí^zona 1

zona II

)

Fig. 14

101

Page 14: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

1. Catálisis enzimática:Las enzimas incrementan extraordinariamente las velocidades de reacción,vanos millares han sido caracterizadas y muchas han sido cristalizadas.

2 Transporte y almacenamiento:Muchas moléculas pequeñas -O,, Fe, por ejemplo- se transportan porproteínas específicas: hemoglobina, mioglobina, transferrina.

3. Soporte mecánico:Las proteínas fibrosas como el colágeno, contribuyen al mantenimientode las propiedades mecánicas de los huesos y la piel.

4. Receptores de membrana:La respuesta a la acción de factores externos a la célula -luz, hormonas,neurotransmisores, opiáceos, toxinas, factores de crecimiento, etc.- se ori-gina en su interacción con proteínas.

5. Factores de crecimiento y diferenciación:Gran número de proteínas cumplen esta función en células específicas-plaquetas, fibroblastos, neuronas, células epiteliales-. El control de la di-visión celular y de la respuesta ¡nmunológica se realiza por medio de pro-teínas específicas.

6 Anticuerpos:Estas proteínas -las inmunoglobulinas- forman parte de los sistemas dedefensa.

7. Coordinación de movimientos:Las proteínas participan en la contracción muscular, movimiento de cro-mosomas, microtúbulos, flagelos.

ción ha resultado de las observaciones bioquímicas, ge-néticas y estructurales de una proteína individual. De otro,y una vez ha sido asignada una función determinada auna proteína individual, se puede buscar la relación deesta función con la de otras proteínas mediante el méto-do de homología, con el que se investiga la semejanza de se-cuencias de aminoácidos con la secuencia de la proteínaoriginal. A través de los métodos de homología, entre el40 y el 70 % de las nuevas secuencias genómicas puedenasignarse a alguna función, incluso de las definidas en lascélulas procarióticas. Y en la actualidad se han desarrolla-do nuevos métodos para detectar las conexiones funcio-nales entre las proteínas. Dentro de ellos, los programasBLAST se utilizan para extender el conocimiento experi-mental de la función de las proteínas a las nuevas secuen-cias genómicas.

Al tradicional método de la homología de secuencias deaminoácidos se han añadido recientemente nuevos méto-dos computacionales, nacidos del conocimiento completode las secuencias genómicas, en los que las correlacionesse establecen entre pares cié proteínas heredadas en variasespecies —método de los perfiles filogenéticos-•, entre domi-nios de proteínas que existen como consecuencia de la fu-sión o entre polipéptidos libres —método de la piedra Ro-setta—, o entre la posición de los genes sobre los cromosomas—método del gen vecino—. Este tipo de análisis da lugar acomplejas redes de conexiones funcionales entre las pro-teínas de las células y, como ha quedado mencionado, al-tera fundamentalmente la idea de la llamada función de unaproteína.

Un perfilfilogenético describe un esquema de relacionesacerca de la presencia o ausencia de una proteína particularen una serie de organismos de genomas conocidos. Enconcreto, este método de los perfiles filogenéticos (figura 15)considera, de un lado, los genomas de una serie de espe-

cies (A, B, C y D) y, de otro, una colección de proteínas(P¡ a P-) que, por completo presentes en A, están presen-tes (1) o ausentes (0) en cada una de las otras tres especies,B, Cy D. Los perfiles de cada una de las proteínas /*, a P7

se reúnen en conjuntos de forma que aparezcan reunidaslas proteínas con los mismos perfiles -en este caso, el parPr-P-7 y el par Ps-P(—, y que aparezcan conectados los per-files con una sola distinción. La conclusión es que si dosproteínas poseen el mismo perfil filogenético -es decir, elmismo esquema de presencia o ausencia- en los genomasexaminados, se infiere que ambas proteínas poseen unarelación funcional; porque ¿cómo cabría pensar en unaevolución a otras especies a no ser por esta relación fun-cional? No obstante, por lo general no se trata de proteí-nas homologas, o, lo que es igual, esta relación funcionalno requiere secuencias similares. La potencia de este mé-todo de los perfiles filogenéticos crece con el número deposibles perfiles considerado; ya que cada proteína puedeestar presente o ausente en cada genoma, y si el númerode genomas secuenciados es «, el número de perfiles será 2".Resulta, pues, que si pueden conocerse las secuencias de30 genomas, el número de perfiles filogenéticos posiblesserá 2M) (= 10'). Número que excede el número de fami-lias de proteínas, de forma que el perfilfilogenético de unaproteína podrá ser una forma cié caracterización práctica-mente única del esquema de distribución entre los geno-mas. Y de aquí que dos proteínas con idénticos o seme-jantes perfiles filogenéticos puedan considerarse implicadasen procesos o estructuras complejas comunes.

Así pues, el perfil filogenético de una proteína describela presencia o ausencia de homólogos en los organismos.Las proteínas que forman parte de complejos multiméri-cos deberán poseer perfiles similares. Y, de igual manera,las proteínas que participen en determinados procesosmetabólicos deberán ser vecinas en cuanto a sus perfilesfilogenéticos. Estos hechos indican que la comparación deperfiles filogenéticos no sólo es una herramienta de granutilidad para la identificación de aquellas proteínas que tie-nen una presencia común en complejos estructurales oen la participación en procesos metabólicos, sino tambiénpara llevar a cabo asignaciones funcionales de proteínas nocaracterizadas.

Con cierta frecuencia, dos proteínas independientes, Ay B, de un organismo se expresan en otras especies bajo laforma de proteínas fusionadas. Y, en este caso, existen mu-chas posibilidades de que los dominios A y B posean re-laciones funcionales. Dado, por otro lado, que A y B noposeen secuencias relacionadas, este tipo de conexión nopuede detectarse a través de su homología y ha de hacer-se a través de las secuencias genómicas. Este procedimiento seconoce como el método de la piedra Rosetta.

Un tercer método computacional para poner de mani-fiesto relaciones funcionales en las secuencias genómicases el método del gen vecino. Si en diversos genomas los ge-nes que codifican dos proteínas se encuentran vecinos enel cromosoma correspondiente, las proteínas tienden aencontrarse funcionalmente relacionadas. Dadas, sin em-

102

Page 15: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTF.OMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

A

P,

P2

P3

P4

P5

P6

P7

perfil

B

1

1

0

1

1

0

1

filogenético

C

0

1

1

0

1

1

1

1

0

1

0

1

1

0

Tp4

Pi 1

p

p

relaciones entre

1

0

3 0

5 0

perfiles

0

P?

0

1

1

5

1 0

1 0

1 1

1

1

Fig. 15

bargo, las especiales características de la regulación géni-ca procariótica -con la presencia de operones comunes-,este método es, de momento, más efectivo en este tipo deorganismos.

En cuanto a la relación de la función con la estructuracorrespondiente, es obvio que existen estructuras peptídicastan sencillas como las de los nonapéptidos hormonales dela glándula hipofisaria —oxitocina, vasopresina— y, frentea ellas, las de los grandes complejos de las deshidrogena-sas, con más de 60 000 aminoácidos. De otro lado, y den-tro de las enzimas mismas, existen moléculas formadaspor una única cadena peptídica, como las hidrolasas, conalrededor de 125 aminoácidos, en tanto que la glutami-na sintasa es un dodecámero con alrededor de 5 500 ami-noácidos. En las figuras 16 y 17 se pueden ver los esque-mas de una serie de proteínas con diferentes tamaños yformas, representados a escala, y responsables de una co-lección variable de actividades biológicas.

Indudablemente, el tamaño y la existencia de proteínasoligoméricas, así como los plegamientos de las cadenasindividuales para dar lugar a diferentes dominios, contri-buyen a la forma de las moléculas, vinculada íntimamente

a su función. Ya ha quedado mencionada la íorma en Yde las inmunoglobulinas como respuesta a la necesariaflexibilidad, imprescindible a la capacidad de unión de li-gandos como función primaria del sistema inmunitario.Las proteínas cuya actividad reside en su naturaleza regu-ladora del DNA adoptan formas con dominios capacesde adaptarse a los surcos del sustrato. Con frecuencia, lossitios activos de las proteínas oligoméricas se localizan enlas interfases entre las subunidades, permitiendo movi-mientos suaves entre ellas como ingredientes importantesde la catálisis o la regulación. En otras ocasiones, las pro-teínas oligoméricas posibilitan la canalización del sustra-to hacia los sitios activos específicos, ganando en eficaciay especificidad, como sucede en el complejo de piruvatodeshidrogenasa.

Dada esta frecuente asociación de unidades monomé-ricas, cabe preguntarse por los motivos de esta preferen-cia frente a las largas cadenas polipeptídicas con múlti-ples sitios activos. Y, entre las diversas interpretaciones deeste hecho, cabe señalar, en primer lugar, la de que loserrores de la biosíntesis se reducen en las cadenas de me-nor longitud. De otro lado, se ha señalado un aumento de

103

Page 16: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

citocromo melitina proteína ligantedeCa

glucagón

factor de necrosistumoral

proteína ligantede DNA

interleuquina 1 p eritrocruonna troponina c

ribonucleasaa

lisozima

inmunoglobulina

carboxipeptidasa A pepsina

hemeritrina

calmodulina

fosfolipasa A2

Fig. 16

la función a través de la asociación y disociación de lassubunidades, con la posibilidad de eliminación de las su-bunidades erróneas y el aumento consiguiente de los oli-gómeros activos. De esta forma, cabe también la posibi-lidad de síntesis de los monómeros en un lugar, y, tras sudifusión, su asociación como oligómeros funcionales en unsitio distante del anterior. O, como en el caso de la he-moglobina de la lamprea, la asociación y disociación com-pletas de las subunidades median una transición coope-rativa. Finalmente, se ha señalado que las proteínasoügoméricas son capaces de experimentar una selección másestricta en el curso de la evolución. En los multímeros ho-mólogos se amplifica el efecto de las mutaciones; por ejem-plo, la mutación de un residuo en la interfase entre las

subunidades de una proteína dimérica cambiará el carácterde los dos contactos. En tanto que, en los oligómeros su-periores, el efecto se incrementa proporcionalmente. Y, aeste propósito, se ha señalado que este hecho constituyeuna ventaja selectiva a lo largo de la evolución.

Además de estas características generales de tamaño yforma, existen algunas estructuras muy singulares que,lógicamente, influyen sobre su función. Entre otras, lassuperhélices o tirabuzones de a-hélices, inicialmente des-critas por Pauling y Corey en 1953, pero cuya resolu-ción no ha sido lograda hasta los últimos años. Estas su-perhélices (coiled coils) constituyen importantes elementosestructurales (figura 18) de una abundante clase de pro-teínas fibrosas responsables de muy variadas funciones.

104

Page 17: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

adenilato quinasa

alcohol deshidrogenasa

D-gliceraldehido 3-Pdeshidrogenasa

glicolato oxidasa

anhidrasa carbónica

citrato sintasa

malatodeshidrogenasa

fosfofrutoqumasa

aspartatocarbamoiltransferasa

Fig. 17

Seguramente, su ejemplo más característico, por el ca-rácter superhelicoidal casi exclusivo de la molécula, esel de la tropomiosina. Sin embargo, el interés por estasproteínas surgió al comienzo de la década de los ochen-ta al determinarse por alta resolución la estructura delos cristales de la hemaglutinina del virus de la gripe y ob-servar que se trata de una superhélice de tres hebras cuyalongitud varía con el pH. Una estructura semejante po-see la proteína ligante de mañosa. A continuación se fue-ron investigando otras proteínas en las que la superhé-lice ocupa posiciones muy variadas en el seno de lamolécula. Así, por ejemplo, la superhélice se encuentraenterrada en la interfase del dímero que constituye laproteína receptora de c-AMP o proteína activadora del gen

de los catabolitos; en tanto que se encuentra libre prácti-camente de interacciones con el resto de la molécula enla seril-tRNA sintasa. En 1988 se identificó su presenciacomo el elemento de dimerización en una clase de fac-tores de transcripción, las llamadas cremalleras de leuci-na (leucine zipper).

Dentro de estas superhélices existen numerosas posi-bilidades de variación de acuerdo con ciertas medidasfísicas, tales como la longitud del paso de hélice y elángulo de cruzamiento de las hélices (figura 19a). Otrasposibilidades de variación resultan de la naturaleza «pa-ralela» o «antiparalela» de las hélices y del distinto tipode empaquetamiento de las cadenas laterales de los ami-noácidos en el corazón del bucle de hélices. De esta

105

Page 18: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

I

hemaglutinina influenza hemaglutimna influenza proteina liganteHA2 (pH7) HA2 (pH4) de mañosa

proteína activadorade catabolitos

seril-tRNA sintasa

manera se producen dos tipos principales de estructu-ras: aquellas de los nudos intracavitarios (figuras 19by 19c), en que un residuo de una hélice -el botón onudo- se encuentra rodeado por cuatro cadenas lateralesde la hélice con la que se enfrenta, y contactando conel residuo equivalente de la otra hélice (knobs-into-ho-les); y aquellas de lomos acanalados (figura 19d), másirregulares y características del empaquetamiento delas proteínas globulares helicoidales (ridges-into-groo-ves). Ambas estructuras pueden originar formas mix-tas y, asimismo, presentar discontinuidades que pro-ducen distorsiones de las hélices. Las funciones de estas

superhélices han resultado ser extraordinariamente va-riadas: largas estructuras de gran resistencia mecánicacomo la queratina de pelos y plumas o la fibrina de loscoágulos sanguíneos; las superficies protectoras de los pa-tógenos, como las proteínas M de los estafilococos; laslipoproteínas que separan la membrana externa de la pa-red celular en las bacterias; suministran un esqueletopara los complejos reguladores, tipo tropomiosina; lossoportes y levas moleculares, como las estructuras dequinesina, hemaglutininas y miosina; las estructuras di-námicas de varias familias de activadores transcripcio-nales; los «dedos» y «brazos» antiparalelos de enzimas queutilizan DNA y RNA como sustratos; en la hemagluti-nina del virus de la gripe, la superhélice central sumi-nistra una especie de charnela que se pone en marchatras una disminución del pH para impeler una fusiónpeptídica hidrofóbica, que toma parte del mecanismode liberación del virus en la célula, a través de una fu-sión de membrana.

UNIDADES MODULARES DE LAS PROTEÍNAS

Mediante los métodos de cristalografía de rayos X y deespectroscopia de resonancia magnética, se ha demostra-do que muchas proteínas de los organismos multicelula-res están construidas a partir de varios módulos o domi-nios autónomos, fácilmente identificables, entre las que seencuentran las proteínas responsables de la coagulación,lafibrinolisis, el complemento, la matriz extracelular, la ad-hesión de la superficie celular y los receptores de citoquinas.La figura 20 muestra representaciones de la estructura tri-dimensional de algunos de los módulos descritos. Las pro-teínas modulares participan especialmente en los meca-nismos de homeostasis sangre-coágulo, la adhesión celular yla transducción de señales.

Hasta el momento no existen reglas definidas sobre elensamblamiento de estos módulos en la construcción delas proteínas multimodulares. Por cristalografía se ha de-

longitud del paso de hélice

ángulo de inclinación

ángulo de cruzamientode las hélices

N

m'V

ÍFig. 19

106

Page 19: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

rPROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

¡nmunoglobulinas

,N CR

hormona decrecimiento

factor H delcomplemento

F1 SH2

SH3

factor de crecimientoepidérmico

PI3-quinasa proteína ligantede mañosa

Fig. 20

mostrado la existencia de los pares I-I en numerosos ca-sos, G-Lec en la selectina y F3-F3 en la molécula de ad-hesión iieuroglian. Por resonancia magnética se ha proba-do la presencia del par Fl-Fl en la fibronectina, C-C enel factor H del complemento, y el par Fl-G en el activadordeplasminógeno tisular. Un importante factor en la cons-trucción modular de las proteínas es la relativa disposi-

ción de las posiciones N- y C-terminales y la longitud delas zonas intercalantes.

La figura 21 muestra un buen ejemplo de la utilización eco-nómica de estos módulos en la construcción de proteínas desuperficie que median importantes interacciones proteína-proteína, como las participantes en los mecanismos bioló-gicos propios de la presentación de antígenos a las células T.

citoquinas - • receptores

célula presentadorade antígeno

1 1 1 1 1 1 2 2 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 1 1 1

F i g . 2 1

107

Page 20: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTIN MUNICIO

factor de crecimienti

La figura 22 muestra otro interesante ejemplo a pro-pósito de los mecanismos de transducción de señales. Setrata de la recepción del factor de crecimiento por su re-ceptor (PDGFR), que posee dominios de tirosina quina-sa que cataliza la fosforilación de varios mediadores (PI3-quinasa, fosfolipasa Cy y la proteína activante de GTPasa)poseedores de módulos SH2 y SH3.

La figura 23 muestra la actuación de diferentes domi-nios de proteínas en un ejemplo de interacciones sinápti-cas. Las sinapsis son uniones asimétricas entre neuronas,que transfieren señales desde una neurona presináptica auna célula postsináptica. En las uniones sinápticas, lasmembranas presinápticas y postsinápticas se conectan pormedio de distintas estructuras capaces de funciones espe-cializadas. En las uniones sinápticas se ha descrito una fa-milia de proteínas de membrana: PSD-95/SAP90, PSD-93/capsyn, SAP102 y SAP97/hDLG. Estas proteínas sonsemejantes a las de otras uniones intercelulares del estilode ZO-1/-2 y dlg-A. Y todas ellas están compuestas detres dominios PDZ NH2-terminales, un único dominiointerior SH3 y un dominio COOH-terminal de guanila-to ciclasa enzimáticamente inactivo. Los tres dominiosPDZ de PSD-95 y proteínas relacionadas interaccionan demanera específica: con las secuencias COOH-terminalesde los canales de K\ con los receptores NMDA2 y con lasneuroliginas. En virtud de estas interacciones se consi-guen agrupamientos de los canales de K* y de receptoresNMDA en las sinapsis. Las neuroliginas son proteínas dela superficie celular de las neuronas, y están compuestasde un dominio extracelular que recuerda a la acetilcoli-nesterasa, un dominio transmembranar y una secuenciaintracelular muy conservada. El dominio extracelular delas neuroliginas interacciona fuertemente con el dominioextracelular de las proteínas de superficie (3-neurexinas.Incluso, neuroliginas y (5-neurexinas, localizadas en célulasindependientes, se unen entre sí y dan lugar a uniones in-tercelulares heterotípicas. Asimismo se ha descrito una

vesícula sinápticas Dominios

0D

SH3

PTB

GKPDZ

canales de Ca2

neuroliginaNMDAR canales

deK+

membranapresináptica

hendidura sináptica

membranapostsináptica

PSD-95 (proteína de membrana postsináptica)

EphR (receptor de eritropoyetina)

AMPAR (receptor de a-amino-3-hidroxi-5-metil¡soxazolprop¡ónico)

GKAP (proteína asociada a la guanilato quinasa)

S-SCAM (molécula multifundonal sináptica)

-SCAM GRIP/ABP

NMDAR (receptor de N-metil-D-aspartato)

CaMKII (proteína quinasa II dependientede calmodulina)

GK (guanilato quinasa)

Syn (sinapsina) Fig. 23

108

Page 21: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

proteína multiligando, S-SCAM (synaptic scaffoldingmo-lecule), capaz de reunir receptores y proteínas de adhesióncelular en las uniones sinápticas.

PLEGAMIENTO DE LAS PROTEÍNAS

Ya se ha visto cómo las proteínas son cadenas lineales deaminoácidos que adoptan estructuras tridimensionalesúnicas, lo que les permite llevar a cabo funciones biológicassingulares, y que, dadas las condiciones apropiadas, la ma-yoría de ellas se pliegan espontáneamente hacia sus esta-dos nativos. Estas cadenas polipeptídicas que forman lasproteínas poseen miles de átomos y, por tanto, la posibi-lidad de millones de interacciones interatómicas. De talcomplejidad hubiera parecido imposible realizar predicciónalguna acerca de la estructura de las proteínas y de susmecanismos de plegamiento. Sin embargo, toda la infor-mación que una proteína necesita para adquirir su es-tructura tridimensional se encuentra en la secuencia deaminoácidos.

Así pues, el problema del plegamiento de las proteínasse plantea de manera muy simple: ¿cómo la estructuraprimaria de las proteínas es capaz de especificar los nive-les estructurales tridimensionales superiores? El proble-ma físico tiene un gran interés científico intrínseco, yaque el paso de unas moléculas con un elevadísimo nú-mero de grados de libertad a una única estructura tridi-mensional portadora de funciones singulares es uno delos casos más sencillos de autoorganización biológica. Porotro lado, el problema es de gran importancia práctica enla era genómica, puesto que la interpretación de la enor-me información resultante de la secuenciación del DNAha de requerir la determinación de las estructuras y fun-ciones de las cadenas polipeptídicas codificadas. Y, portanto, la predicción de las estructuras proteicas será deimportancia fundamental en este proceso.

Dado que el número de conformaciones accesibles auna cadena polipeptídica crece exponencialmente con lalongitud de la cadena, el punto de partida para la elabo-ración de un modelo que intente describir el plegamien-to de una proteína serán los datos experimentales obteni-dos con cadenas cortas, inferiores a los 100 residuos. Y, así,estas reacciones de plegamiento pueden, en general, mo-delizarse como una transición entre dos estados: un esta-do desordenado desnaturalizado y otro nativo ordenado.Sin embargo, la cinética de plegamiento de las proteínasde gran longitud parece estar dominado por el abandono delas conformaciones no-nativas de baja energía libre. Esteplegamiento de las largas proteínas viene ocasionalmen-te facilitado por las chaperonas moleculares, que impiden laagregación impropia de las proteínas. Para pasar de un es-tado no-nativo, sin plegamientos, a un estado nativo debaja energía libre, la proteína ha de atravesar estadosde transición de elevada energía libre, cuya heterogeneidadha sido objeto de repetidos trabajos. En el estado inicial,sin plegamientos, la proteína puede adquirir una de las

muchas conformaciones, mientras que en el estado nati-vo posee solamente una o pocas conformaciones distintas.

Las medidas experimentales conducentes a la modeli-zación de la reacción de plegamiento de las cadenas po-lipeptídicas cortas son: la velocidad de plegamiento; ladistribución de las estructuras en el estado de transición,deducido de los efectos de las mutaciones sobre lavelocidad de plegamiento, y la estructura del estado na-tivo. Varias líneas de investigación indican que la topo-logía de una proteína determina el mecanismo y la velo-cidad del plegamiento de las cadenas en mayor medidaque las interacciones interatómicas. En primer lugar, loscambios de las largas cadenas en la secuencia de amino-ácidos, ya sean de carácter evolutivo o experimental, queno alteran la topología global de una proteína ejercen,por lo general, un efecto muy pequeño sobre la velocidadde plegamiento; lo que sugiere que la evolución no haoptimizado las secuencias de aminoácidos para lograr unplegamiento más rápido. En segundo término, se ha com-probado que las estructuras de los estados de transiciónson muy insensibles a los cambios profundos de la se-cuencia, al estudiar los estados de transición de las pro-teínas con similares estructuras pero diferentes secuen-cias. Y, en tercer término, las velocidades de plegamientode las pequeñas proteínas se correlacionan con la topo-logía del estado nativo, y en particular con la separaciónsecuencial media entre los residuos que contactan en laestructura tridimensional, el llamado orden de contacto. Así,las proteínas con una buena parte de los contactos entrelos residuos cercanos en la secuencia -orden de contac-to «bajo»- tienden a plegarse más rápidamente que lasproteínas con mayor número de contactos no-locales -or-den de contacto «elevado»-. Esta correlación da cuentade la gran variabilidad de la velocidad de plegamiento, loque es importante dadas las grandes diferencias en las se-cuencias y estructuras de las proteínas comparadas. Esdecir, las sencillas consideraciones geométricas explicanen gran medida las diferencias de las velocidades de ple-gamiento de las diversas proteínas.

Por otro lado, el importante papel de la topología del es-tado nativo se subraya al considerar el elevado coste en-trópico de la formación de contactos entre residuos dis-tantes en la secuencia al comienzo de los plegamientos,debido a que ello restringe el número de conformacionesdisponibles a los segmentos implicados. Por esta razón,las interacciones entre los residuos cercanos en la secuenciase encuentran más favorecidas en los plegamientos inicialesque aquellas entre residuos con una separación notable, deforma que, para una topología dada, las interacciones lo-cales tienen lugar más rápidamente que las no-locales.Y, en lógica consecuencia, aquellas topologías sencillasdotadas mayoritariamente de interacciones locales se for-man más rápidamente que aquellas con numerosas inte-racciones no-locales. Finalmente, la importante partici-pación de la topología se ha concluido así mismo de losestudios de los modelos computacionales de plegamiento de

roteínas.

109

Page 22: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

Como quiera que las secuencias de las cadenas polipeptí-dicas determinan las estructuras tridimensionales, resultaque el ordenamiento de los aminoácidos será capaz dedeterminar tanto la estabilidad de la molécula como losmecanismos de plegamiento. Sin embargo, mientras que ala estabilidad contribuyen otros factores -como las inte-racciones interatómicas—, los mecanismos de plegamientodependen fundamentalmente de las propiedades geomé-tricas del estado nativo.

A partir de estas ideas se han desarrollado dos tipos prin-cipales de modelos para la predicción de los mecanismosde plegamiento: la predicción a partir de la topología y lapredicción «ab initio». En el segundo caso, la predicción con-siste en generar el mayor número posible de conforma-ciones diferentes y calcular la energía de cada una de ellas;y se juzga que la estructura previsible es la conformaciónde energía más baja. Y para llegar a las estructuras tridi-mensionales desde las secuencias, hay que utilizar las in-teracciones entre los átomos en el esqueleto de la molécula,las cadenas laterales y el agua.

ERRORES DE PLEGAMIENTO Y ENFERMEDAD

El elevado número de diferentes tipos de proteínas exis-tentes en la naturaleza y, en particular, en la especie hu-mana -alrededor de las 100 000-, su biogénesis a expen-sas de la información genómica (figura 1) y la extraordinariavariedad de sus funciones (tabla IV), capaces de contro-lar cada uno de los acontecimientos biológicos, unido a lamultiplicidad de bellas formas que presentan en su esta-do nativo, a los complejos mecanismos de su plegamien-to natural y a los procedimientos evolutivos de los siste-mas biológicos que aseguran su corrección —o, en caso

contrario, su destrucción, para evitar el daño al organis-mo huésped- dan cuenta de las numerosas posibilidades deerrores de plegamiento de las proteínas y, por tanto, de susconsecuencias y de las posibilidades de disfunción de la ma-quinaria celular.

A modo de ejemplo, hfibrosis cística es un caso en el queuna mutación génica ocasiona el plegamiento incorrectode la proteína responsable del transporte y, de aquí, la im-posibilidad de su secreción en la cantidad requerida parael correcto ejercicio de su función. Una situación semejantees la que se presenta en el enfisema familiar, debido a quela mutación ocasiona un tráfico incorrecto de las proteí-nas implicadas. Sin embargo, el mayor interés lo presen-ta actualmente el conjunto de enfermedades caracteriza-das por la conversión de proteínas solubles, o de susfragmentos, en placas o fibrillas insolubles que se acu-mulan en una variedad de órganos: hígado, bazo y cere-bro. Son las enfermedades que se agrupan como amiloi-dosis; entre ellas, las enfermedades de Parkinson yAlzheimer,las encefalopatías del tipo Creutzfeldt-Jakob, la diabetestipo II y una corta serie de condiciones diversas entre lasque se incluye el insomnio familiar fatal. Cada enfermedadestá asociada a la acumulación de una proteína particular;algunas bien conocidas, como priones, hsozima y transti-retina — homotetrámero de 1 5.87 kDa, elipsoiodea, presenteen la sangre y ligante de hormonas tiroideas-, y tambiéna una cantidad determinada, muy elevada en algunas delas manifestaciones patológicas.

Las fibrillas o placas amiloideas son agregados protei-náceos que presentan una birrefringencia verde caracte-rística bajo luz polarizada y un desplazamiento al rojo enla absorción del rojo Congo; fenómenos ambos atribuidosa la interacción del colorante con las cadenas de la proteí-na regularmente espaciadas (figura 24). La capacidad de

espacio extracelular

nativa

no plegada

Fig. 24

110

Page 23: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTF.ÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

formar amiloides es una propiedad genérica de las cadenaspolipeptídicas, interpretada por el hecho de que los enla-ces intermoleculares que estabilizan este material estánimplicados en el esqueleto peptídico común a todas lasproteínas. Sin embargo, la formación de fibrillas está res-tringida a un corto número de proteínas. Y a este propó-sito queda abierta la cuestión: de un lado, acerca del mo-tivo o de los motivos por los que la mayor parte de lasproteínas tienen impedido el acceso en el organismo aeste tipo de materiales; de otro, acerca de su formación,favorecida por la mutación de la secuencia de aminoáci-dos en las proteínas relacionadas con la enfermedad, bajoinfecciones, o por el envejecimiento.

Una modificación estructural semejante guarda rela-ción con el conjunto de problemas subyacentes a la ence-falopatía espongiforme bovina, llamada vulgarmente enfer-medad de las vacas locas, y su propagación al hombre porvía alimentaria bajo una nueva forma de la enfermedad deCreutzfeldt-Jakob, de la cual, al finalizar el año 2000, se ha-bían detectado 79 casos en Gran Bretaña y dos en Francia.Quedan por aclarar las formas de transmisión y los pe-riodos de incubación en el hombre, así como las funcio-nes fisiológicas que las proteínas de los priones sobre la su-perficie de las neuronas cumplen en la transmisión deciertas señales celulares, que se alteran profundamente trasla modificación estructural que aparece en la figura 25.

Estudios llevados a cabo con Saccharomyces cerevisiaehan conducido al descubrimiento de proteínas con pro-piedades infectivas, relacionadas con las de los priones demamíferos. Estos priones de levaduras, especie de materialgenético no cromosómico, son capaces de convertirse invitro en agregados ordenados con todas las característicasde las fibrillas amiloides; capacidad de pasar a una formaamiloidea que es transmisible a través de la división celu-lar. Estas propiedades de los priones de levaduras y && hon-gos sugieren que la transferencia de información genéti-ca es posible sin la presencia de los ácidos nucleicos. Porotro lado, el mejor conocimiento de las fibrillas amiloides,y de su formación, redundará en la comprensión de lascondiciones patológicas que conducen a muchas de las en-fermedades, consecuencia del notorio envejecimiento de

la población moderna, así como en la mejora de las opor-tunidades para su prevención y tratamiento.

LA FUNCIÓN DE LAS PROTEÍNAS

EN LA ERA POSTGENÓMICA

La disponibilidad en el año 2000 de alrededor de dosdocenas de genomas secuenciados y de los perfiles de ex-presión ha facilitado el desarrollo de métodos computa-cionales y de nuevas estrategias para encontrar las cone-xiones funcionales entre las proteínas. Recientemente sehan determinado las relaciones funcionales existentes en-tre las 6 217 proteínas de la levadura Saccharomyces cere-visiae, agrupadas a través de las correlaciones de los perfi-les filogenéticos, los esquemas de expresión del mRNA y lafusión de dominios. En el Instituto de Biología Molecularde UCLA se ha desarrollado un algoritmo que, median-te estos procedimientos, ha descubierto más de 93 000conexiones entre proteínas de levadura relacionadas fun-cionalmente. Las conexiones entre proteínas caracteriza-das y no caracterizadas han permitido asignar una fun-ción a más de la mitad de las 2 557 proteínas sincaracterización previa. Este tipo de conexiones funciona-les se ha establecido entre una familia de proteínas de fun-ción desconocida previamente, una proteína cuyas ho-mologas humanas están implicadas en el cáncer de colony el prión de levadura Sup35-

La figura 26 muestra las estrategias utilizadas para el es-tablecimiento de las conexiones mencionadas en Saccha-romyces cerevisiae, a la vez que el número de ellas estable-cidas por cada uno de los procedimientos utilizados. Lasinteracciones experimentales (a) utilizan los datos de la li-teratura que emplean técnicas como la co-inmunopreci-pitación y los procedentes de las bases de datos sobre lasinteracciones proteína-proteína. La función metabólica (b)conexiona aquellas proteínas que operan secuencialmen-te en procesos metabólicos. Los perfiles filogenéticos (c) seconstruyen para conexionar las proteínas que han evolu-cionado de manera correlacionada en los organismos congenoma conocido (figura 1 5). El método de la piedra Ro-

, Saccharomyces x

cerevisiae

/ método de conexión entre las proteínas

datos función perfiles piedraexperimentales metabólica filogenéticos Rosetta

expresiónde mRNA

conexiones

i i rpredicción funcional de proteínasno caracterizadas a través de las

conexiones con proteínas caracterizadas Fig. 26

111

Page 24: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

setta (d) conexiona las proteínas homologas que se fusio-nan en un único gen en otro organismo. La expresión delmARN (e) sirve para correlacionar las proteínas con losniveles de mRNA. Este conjunto de análisis produce re-des de conexiones funcionales entre las proteínas y -aun-que sea reiterativo insistir en ello- ha alterado funda-mentalmente el significado de la idea «función de unaproteína».

Otro ejemplo interesante es el que ofrecen los resulta-dos de las conexiones funcionales del prión de levaduraSup35. En la figura 27 se ilustra la complicada red de co-

O síntesis y plegamiento deproteínas

m corte y empalme de mRNA,traducción, biogénesis deribosomas

• localización de proteínas

O otros

perfiles filogenéticos

_ _ . . . . . . experimental

• métodos de predicción (mas dedos)

Fig. 27

nexiones de distinto tipo de la proteína del prión de le-vadura, que actúa en su estado precursor como un factorde liberación de las cadenas traducidas; conexiones condiversas proteínas, como las implicadas en la síntesis y ple-gamientos de las proteínas -consistente con la funciónprimaria de Sup35 que interacciona con el ribosoma paraliberar la cadena peptídica recién sintetizada—, las proteí-nas que guían las proteínas nacientes a su destino celularfinal y con el sistema de chaperoninas (CCT) que colaboraen el plegamiento de la actina y los microtúbulos reciénsintetizados. En esta red, la mayoría de las conexiones es-tán reconocidas mediante los perfiles filogenéticos, el métodode la piedra Rosetta y los esquemas de expresión del mRNA.Resulta interesante hacer notar como hecho central de es-tas redes que la mayor parte de las proteínas interaccionancon otras proteínas; y, más particularmente, que las co-nexiones de la proteína Sup35, cuya función es la regula-ción de la traducción, se establecen con otras relacionadascon la síntesis, el plegamiento y la localización de este tipode moléculas.

Así pues, estos nuevos métodos para el establecimientode conexiones funcionales entre las proteínas, a los que,indudablemente, contribuyen el conocimiento progresi-vo de secuencias genómicas completas y de los datos so-bre la expresión de mRNAs, originan redes de interac-ciones extraordinariamente complejas.

Como resumen de esta visión de la función de las proteí-nas en la era postgenómica hay que hacer notar que, clá-sicamente, la función de las proteínas estaba basada en la

acción individual de cada una de ellas, como puede serla catálisis de una reacción determinada, o la unión de li-gandos específicos de mayor o menor tamaño (figura 28a).Frente a esta idea «restringida» de función -frecuente-mente conocida como función molecular—, se consideraen la actualidad la idea amplia de la función según la cualuna proteína se define como un elemento en el conjunto desus interacciones (figura 28b). Esta idea amplia de la fun-ción de las proteínas se conoce como función contextúalofunción celular, que intenta significar cómo, en el seno dela materia viva, cada proteína funciona como elemento de unaamplia red de interacciones moleculares. Bajo esta idea seráposible comprender las funciones celulares de aquellasproteínas no caracterizadas por medio de sus interaccio-nes con proteínas caracterizadas. Y así, las redes de cone-xiones ofrecen una nueva visión del significado de \zfim-ción, y una comprensión más profunda del funcionamientode las células.

LA FUNCIÓN DE LAS PROTEÍNAS

Y LAS SECUENCIAS GENÓMICAS

Uno de los nuevos métodos para el estudio de las in-teracciones proteína-proteína utiliza procedimientoscomputacionales para el análisis de las secuencias genó-micas sobre la base de que algunos pares de proteínas co-nexionadas guardan homología con las de otro organis-mo, fusionadas en una única cadena polipeptídica. En eldepartamento de Bioquímica de UCLA se han descritovarios métodos para este análisis de la fusión de dominios.Algunos de ellos utilizan compilaciones de pares de pro-teínas descritas en la literatura; otro método computa-cional es el de los perfiles filogenéticos (figura 15), ya men-cionado, que detecta las interacciones funcionalesanalizando la evolución correlacionada de las proteínas.La investigación de las secuencias de algunos genomasha puesto de manifiesto 6 809 interacciones proteína-proteína en Escherichia coli -a partir de las 4 290 se-cuencias de proteínas de su genoma— y 45 502 interac-ciones en la levadura. Y muchos de estos pares deconexiones están funcionalmente relacionados. En la fi-gura 29 aparecen algunos de los pares de proteínas que in-teraccionan en E. coli y que se encuentran fusionadas enuna única cadena de otros organismos.

112

Page 25: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

topoisomerasa II (levadura)girasa B (E. coli)gírasa A (E. coli)

succinilCoA transferasa (humana)acetilCoA transferasaaff. coli)acetiICoA transferasapff. coli)

DNA polimerasa III a (B. subtilis)DNA polimerasa III a (E. coli)DNA polimerasa III E (E. coli)

hístidina bíosíntesis HIS2 (levadura)hístidína biosíntesis HIS2 (E. coli)histidina biosíntesís HIS10 (E. coli)

6-1-p¡rrolina-5-carboxíl¡co sintasa (humana)y-glutamilfosfato reductasa (E. coli)glutamato 5-qu¡nasa (E. coli)

Fig. 29

El análisis y la reconstrucción de procesos metabólicosen E. coli por los métodos descritos de fusión de dominiosha permitido el descubrimiento de interacciones acopla-das. En la figura 30 aparecen los esquemas de las trans-formaciones metabólicas correspondientes a las síntesis

del ácido shiquímico (A) y de las purinas (B), ordenadassegún el método tradicional de la acción de las sucesivasenzimas sobre los correspondientes metabolitos; algunasde estas enzimas están conexionadas con otras del mismoproceso y aparecen en negrita. Los esquemas C y D re-

113

Page 26: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

presentan las transformaciones sugeridas por las interac-ciones habidas, a la vez, entre enzimas secuenciales delproceso y entre miembros más distantes, posiblemente através de complejos multienzimáticos.

Así pues, la información genómica ha abierto nuevasvías a descubrimientos bioquímicos acerca de nuevos pro-cesos o de nuevos complejos de proteínas en los diferen-tes organismos.

INGENIERÍA DE PROTEÍNAS

Durante el tercer cuarto del siglo XX tuvo lugar la pri-mera gran etapa del definitivo conocimiento estructuralde las proteínas, y su aplicación a una amplia colección deproteínas recién descubiertas en los campos de la farma-cología, la agricultura y la industria -por ejemplo, la in-sulina, las toxinas de insectos y las enzimas industriales-.Hubo que llegar, sin embargo, al último cuarto de siglo paraalcanzar el descubrimiento de la tecnología del DNA-re-combinante y, con ella, la posibilidad de producción di-

recta artificial de proteínas humanas, comienzo de los ul-teriores desarrollos de la ingeniería de proteínas. A elloshan contribuido toda la serie de procedimientos encami-nados al mejor conocimiento de la estructura de las pro-teínas y al de las relaciones estructura-función. Entre otros,la averiguación de la secuencia de aminoácidos, la creacióny modificación de grupos funcionales, y la determinaciónde las estructuras tridimensionales por difracción de rayos Xy la espectroscopia de resonancia magnética, con las quese ha podido averiguar la topografía de las superficies com-plementarias entre las que se establecen las interaccionesligando-proteína y proteína-proteína, determinantes degran parte de las funciones biológicas. Interacciones quepueden examinarse mediante la visión gráfica compu-tarizada que permite modular parámetros del tipo deespecificidad, estabilidad y afinidad de unión, como con-secuencia de hipotéticas modificaciones estructurales, in-cluidos los cambios mutacionales de aminoácidos.

Fruto de todo ello ha sido la aplicación de la modificaciónestructural de proteínas -la ingeniería de proteínas- aldiseño de variaciones en la función de enzimas, anticuer-

proteínas deseres vivos

expresión (mg)

/mutagénesis

dirigida

rbioquímicapreparativa

química orgánicasintética

ensayo ycaracterización

de proteínas i

nodificación estructural(diseño) i

iinteracciones

proteína-ligando

dicroismo circulary fluorescencia

clonacióngénica

Rayos X y RMN (2D)

visión gráficacomputarizada

(3D)

íbases de datos

(estructura primaria yterciaria, propiedades)

Fig. 31

114

Page 27: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTF.ÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN l.AS PROTF.ÍNAS?

(a) peptidoteca

osegmento de

secuencia randomizadapéptido lineal péptido restricto

(b) archivo de fragmentos de anticuerpos

genes de cadenas pesadas

genes de cadenas ligeras

seis segmentos de secuenciasrandomizadas

scFv

Fig. 32

pos, ligandos, receptores de membrana, proteínas transdiictomsde señales, etc., y a las posibilidades de modificación. Todoeste conjunto de aproximaciones al estudio de las rela-ciones estructura-función constituye el llamado ciclo de di-seño (figura 31), fundamental para el tratamiento inter-disciplinar racional de las proteínas, y conducente a susaplicaciones específicas.

Dentro de los esquemas de diseño de nuevas activida-des de proteínas, la creación de nuevas actividades de uniónde ligandos tiene una significación especial, ya que otorgaa estas moléculas la funcionalidad propia de todos los pro-cesos de reconocimiento molecular, al estilo de los impli-cados en los numerosos mecanismos de transducción deseñales, y de sus variadas aplicaciones comerciales comoreactivos de diagnóstico o agentes terapéuticos de diver-sa índole —nuevos anticuerpos, pequeñas proteínas útilescomo ligandos de receptores de superficie, etc.-. En estadirección se han descrito en los últimos años diversas téc-nicas para generar péptidos y proteínas con especiales ac-tividades de unión de ligandos. Entre estas técnicas, \os fa-gos filamentosos reúnen características singulares para laselección de repertorios de estos péptidos o proteínas que,fusionados con las proteínas de la cubierta, pueden ex-presarse bajo una conformación funcional. A este objeto,los genes codificantes, cuyas secuencias se conocen o de-terminan, se encapsulan dentro de la cubierta del fago, ylos péptidos o proteínas se aislan y purifican por afinidadsobre un lecho inmovilizado. De esta manera, se han ori-ginado muchos archivos de péptidos (peptidotecas) de di-ferentes tamaños (figura 32a) —en los que la variación seintroduce en un único fragmento-, que pueden utilizar-se corno ligandos estructurales o para modelizar las acti-vidades biológicas de moléculas de mayor magnitud. El pri-mero de estos archivos de fagos estuvo constituido porpéptidos randomizados de seis residuos, fusionados a laposición N-terminal de la proteína de adsorción delfago pIII. Posteriormente se han generado otros muchos

archivos de péptidos de diferente tamaño -de hasta 40 re-siduos— y conformación.

De igual manera, por medio de los fagos pueden crear-se los archivos de proteínas plegadas, cuyos residuos serandomizan simultáneamente en varias regiones discon-tinuas de la cadena polipeptídica. Y estos residuos rando-mizados, en el seno de la proteína plegada, forman lo quesemeja un parche continuo sobre la superficie de la pro-teína. Uno de los ejemplos más representativos de estatécnica (patch engineering) es el archivo de anticuerpos (fi-gura 32b), en el que la variación se logra por randomi-zación de seis diferentes regiones de la cadena polipeptí-dica. Estas regiones, a través de plegamientos, se ponen encontacto sobre una cara de la proteína para originar un re-pertorio de fragmentos Fab o de fragmentos scFv (singlechain Fv).

Esta técnica ha sido utilizada recientemente para la crea-ción de sitios adicionales de unión en varias proteínas,por ejemplo, en un inhibidor de a-amilasa, de 74 resi-duos, procedente de Streptomyces tendae, y en citocromo/?,(,,, de 106 residuos, que se pliega en una estructura entirabuzón de cuatro hélices, estabilizada por unión delhemo (figuras 11 y 12). Y así, dos lazos superficiales, cons-tituidos por los residuos 37-41 y 88-92, que no participanen los contactos con el hemo, forman un parche de 100 A"(figura 33) que ha podido ser randomizado en otra pro-teína con actividad de unión de ligandos modificadao adicional. Estos repertorios pueden ponerse de mani-fiesto en fagos, y, mediante selección, aislarse proteínascon nuevas actividades de unión.

IDENTIFICACIÓN Y ANÁLISIS DE PROTEÍNAS

Si la proteómica se ha asociado a la exhibición de ungran número de proteínas a partir de un organismo o unalínea celular determinados, utilizando los sistemas de se-

115

Page 28: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

ÁNGEL MARTÍN MUNICIO

paración más eficientes, tal como la electroforesis bidi-mensional en gel de poliacrilamida, habrá que señalar queya en la década de los setenta se comenzaron a construirbases de datos de las proteínas a partir de las-separacioneslogradas mediante este tipo de técnicas. Sin embargo, noera fácil en esa fecha la rápida caracterización analítica delas proteínas, y hubo que esperar, en la década de los no-venta, al desarrollo de un poderoso método analítico, laespectrometría de masas, con el que solucionar todas las li-mitaciones anteriores. Este desarrollo, unido a la dispo-nibilidad pública de las secuencias genómicas, ha desem-bocado en el análisis funcional de los productos de losgenes; área que, fundamentalmente, cubre el nuevo campode la proteómica.

BIBLIOGRAFÍA

• ABBOTT, A., «How to spot a protein in a crowd», Na-ture 402, 1999, págs. 716-720.

• ALM, E. y BAKER, D., «Prediction of protein-foldingmechanisms from free-energy landscapes derived fromnative structures», Proc. Nati. Acad. Sci. USA 96, 1999,págs. 11305-11310.

1 ANDERSON, N. G. yANDERSON, N. I., «Twenty yearsof two-dimensional electrophoresis: past, present andfuture», Electrophoresis 17, 1996, págs. 443-453.

1 BAKER, D., «A surprising simplicity to protein folding»Nature 405, 2000, págs. 39-42.

1 BLUNDELL, T. L, «Problems and solutions in protein en-gineering-towards rational design», T1BTECH'12, 1994,págs. 145-148.

1 BORMAN, S., «Biochemical Genomics», C&EN 5, 1999.1 CHOTHIA, C., «One thousand families for the molecular

biologist», Nature 357, 1992, págs. 543-544.ElSENBERG, D., MARCOTTE, E. M., XENARIOS, I. yYEATES, T. O., «Protein function in the post-genomicera», Nature 405, 2000, págs. 823-826.GOODSELL, D. S. y OLSON, A. J., «Soluble proteins: size,shape and function», TIBS 18, 1993, págs. 65-68.HIRAO, K., HATA, Y., IDE, N., TAKEUCHI, M., IRIE,

M., YAO, I., DEGUCHI, M., TOYODA, A., SUDHOF,

T. C. y TAKAI, Y, «A Novel Múltiple PDZ Domain-con-taining Molecule Interacting with N-Methyl-D-aspar-tate Receptors and Neuronal Cell Adhesión Proteins»,/ Biol. Chem. 273, 1998, págs. 21105-21110.HOLM, L. y SANDER, C., «Mapping the Protein Uni-verse», Science 273, 1996, pág. 595.IRIE, M., HATA, Y, TAKEUCHI, M., ICHTCHENKO, K.,

TOYODA, A., HIRAO, K., TAKAI, Y, ROSAHL T. W. y

SÜDHOF, T. C., «Binding of neuroligins to PSD-95»,Science 277, 1997, págs. 1511-1515.LANDSCHULZ, W. H., JOHNSON, P. F. y MCKNIGHT,

S. L., «The Leucine Zipper: A Hypothetical StructureCommon to a New Class of DNA Binding Proteins»,Science 240, 1988, págs. 1759-1764.MARCOTTE, E. M., PELLEGRINI, M., HO-LEUNG NG,RICE, D. W., YEATES, T. O. y EISENBERG, D., «Detec-

ting Protein Function and Protein-Protein Interactionsfrom Genome Sequences», Science 285, 1999, págs. 751-753.—, PELLEGRINI, M., THOMPSON, M. J., YEATES, T. O.y ElSENBERG, D., «A combined algorithm for genome-wide prediction of protein function», Nature 402, 1999,págs. 83-86.MARTÍN MUNICIO, A., «Medicamentos viejos para en-fermedades nuevas», Horizontes culturales. Las fronterasde la ciencia, Real Academia de Ciencias, Madrid, 1998.—, «Presente y futuro de la biotecnología», Horizontesculturales. Las fronteras de la ciencia, Real Academia deCiencias, Madrid, 1999.O'FARRELL, P. H., «High resolution two-dimensionalelectrophoresis of proteins»,/ Biol. Chem. 250, 1975,págs. 1007-1021.PANDEY, A. y MANN, M., «Proteomics to study genesand genomes», Nature 405, 2000, págs. 837-846.PELLEGRINI, M., MARCOTTE, E. M., THOMPSON, M. J.,ElSENBERG, D. y YEATES, T. O., «Assigning proteinfunctions by comparative genome analysis: Protein phy-logenetic profiles», Proc. Nati. Acad. Sci. USA 96, 1999,págs. 4285-4288.

116

Page 29: PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS · PDF filetas especies, el hombre incluido, y de manera colindante o, quizá, solapándose, ... conviene anticipar para el mejor conocimiento

PROTEÓMICA: ¿QUÉ SON Y PARA QUÉ SIRVEN LAS PROTEÍNAS?

SALÍ, A., «Functional links berween proteins», Nature * SMITH, G., «Patch engineering: a general approach for402, 1999, págs. 23-26. creating proteins that have new binding activities», TIBSSCHEIFFELE, P, FAN, J., CHOIH, J., FETTER R. y SE- 23, 1998, págs. 457-460.RAFINI, T., «Neuroligin Expressed in Nonneuronal Cells • SONG, J. Y., ICHTCHENKO, K., SÜDHOF, T. C. y BRO-Triggers Presynaptic Development in Contacting Axons», SE, N., «Neuroligin 1 is a postsynaptic cell-adhesionCell 101, 2000, págs. 657-669. molecule of excitatory synapses», Proc. Nati. Acad. Sci.SCHOMBURG, D., «A broad perspective on protein en- USA 96, 1999, págs. 1100-1105.gineering and complementary technologies», TIBTECH • THIEFFRY, D. y SARKAR, S., «Forty years under the cen-13, 1995, págs. 45-47. tral dogma», TIBS 23, 1998, págs. 312-316.

117